2025, ഒക്‌ടോബർ 2മലയാളം

റാഫ്റ്റ് വികേന്ദ്രീകൃത സമവായ അൽഗോരിതം, അതിന്റെ തത്വങ്ങൾ, പ്രവർത്തന ഘട്ടങ്ങൾ, നടപ്പിലാക്കൽ, ആഗോളതലത്തിൽ വികസിപ്പിക്കാവുന്ന സിസ്റ്റങ്ങൾക്കായുള്ള യഥാർത്ഥ ലോക ആപ്ലിക്കേഷനുകൾ എന്നിവ പര്യവേക്ഷണം ചെയ്യുക.

വികേന്ദ്രീകൃത സമവായം കൈകാര്യം ചെയ്യുക: ആഗോള സിസ്റ്റങ്ങൾക്കായുള്ള റാഫ്റ്റ് അൽഗോരിതം നടപ്പിലാക്കലിനെക്കുറിച്ചുള്ള ആഴത്തിലുള്ള പഠനം

നമ്മുടെ കൂടുതൽ പരസ്പരം ബന്ധിപ്പിക്കപ്പെട്ട ലോകത്ത്, വിതരണം ചെയ്ത സിസ്റ്റങ്ങൾ ഇ-കൊമേഴ്‌സ് പ്ലാറ്റ്‌ഫോമുകൾ, സാമ്പത്തിക സ്ഥാപനങ്ങൾ മുതൽ ക്ലൗഡ് കമ്പ്യൂട്ടിംഗ് ഇൻഫ്രാസ്ട്രക്ചർ, തത്സമയ ആശയവിനിമയ ഉപകരണങ്ങൾ എന്നിവ വരെയുള്ള മിക്കവാറും എല്ലാ ഡിജിറ്റൽ സേവനങ്ങളുടെയും നട്ടെല്ലാണ്. ഈ സിസ്റ്റങ്ങൾ വർക്ക് ലോഡുകളും ഡാറ്റയും ഒന്നിലധികം മെഷീനുകളിലായി വിതരണം ചെയ്യുന്നതിലൂടെ സമാനതകളില്ലാത്ത സ്കേലബിലിറ്റി, ലഭ്യത, അതിജീവനശേഷി എന്നിവ വാഗ്ദാനം ചെയ്യുന്നു. എന്നിരുന്നാലും, ഈ ശക്തി ഒരു പ്രധാന വെല്ലുവിളിയുമായി വരുന്നു: നെറ്റ്‌വർക്ക് കാലതാമസങ്ങൾ, നോഡ് തകരാറുകൾ, ഒരേസമയം നടക്കുന്ന പ്രവർത്തനങ്ങൾ എന്നിവയുടെ പശ്ചാത്തലത്തിലും സിസ്റ്റത്തിന്റെ എല്ലാ ഘടകങ്ങളും ഒരേ അവസ്ഥയിൽ യോജിക്കുന്നുവെന്ന് ഉറപ്പാക്കുക. ഈ അടിസ്ഥാന പ്രശ്നം വികേന്ദ്രീകൃത സമവായം എന്നാണ് അറിയപ്പെടുന്നത്.

അസമന്വിതവും തകരാറുകൾക്ക് സാധ്യതയുള്ളതുമായ ഒരു വിതരണം ചെയ്ത പരിതസ്ഥിതിയിൽ സമവായം നേടുന്നത് വളരെ സങ്കീർണ്ണമാണ്. പതിറ്റാണ്ടുകളായി, പാക്സോസ് (Paxos) ഈ വെല്ലുവിളി പരിഹരിക്കുന്നതിനുള്ള പ്രബലമായ അൽഗോരിതം ആയിരുന്നു. അതിന്റെ സൈദ്ധാന്തികമായ കൃത്യതയ്ക്ക് ഇത് ബഹുമാനിക്കപ്പെട്ടിരുന്നുവെങ്കിലും, അതിന്റെ സങ്കീർണ്ണതയും നടപ്പിലാക്കാനുള്ള പ്രയാസവും കാരണം പലപ്പോഴും വിമർശിക്കപ്പെട്ടു. പിന്നീട്, റാഫ്റ്റ് (Raft) എന്ന അൽഗോരിതം വന്നു. ഇതിന്റെ പ്രാഥമിക ലക്ഷ്യം മനസ്സിലാക്കാനുള്ള എളുപ്പം ആയിരുന്നു. തെറ്റുകൾ സഹിക്കാനുള്ള കഴിവിന്റെയും പ്രകടനത്തിന്റെയും കാര്യത്തിൽ പാക്സോസിന് തുല്യമായിരിക്കാൻ റാഫ്റ്റ് ലക്ഷ്യമിടുന്നു, എന്നാൽ ഡെവലപ്പർമാർക്ക് മനസ്സിലാക്കാനും നിർമ്മിക്കാനും വളരെ എളുപ്പമുള്ള രീതിയിലാണ് ഇത് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്.

ഈ സമഗ്രമായ ഗൈഡ് റാഫ്റ്റ് അൽഗോരിതത്തെക്കുറിച്ച് ആഴത്തിൽ പ്രതിപാദിക്കുന്നു. അതിന്റെ അടിസ്ഥാന തത്വങ്ങൾ, പ്രവർത്തന രീതികൾ, പ്രായോഗിക നടപ്പിലാക്കൽ പരിഗണനകൾ, കരുത്തുറ്റതും ആഗോളതലത്തിൽ വിതരണം ചെയ്തതുമായ ആപ്ലിക്കേഷനുകൾ നിർമ്മിക്കുന്നതിലെ അതിന്റെ സുപ്രധാന പങ്ക് എന്നിവയെല്ലാം ഇതിൽ വിശദീകരിക്കുന്നു. നിങ്ങൾ പരിചയസമ്പന്നനായ ഒരു ആർക്കിടെക്റ്റോ, വിതരണം ചെയ്ത സിസ്റ്റംസ് എഞ്ചിനീയറോ, അല്ലെങ്കിൽ ഉയർന്ന ലഭ്യതയുള്ള സേവനങ്ങൾ നിർമ്മിക്കാൻ ആഗ്രഹിക്കുന്ന ഒരു ഡെവലപ്പറോ ആകട്ടെ, ആധുനിക കമ്പ്യൂട്ടിംഗിന്റെ സങ്കീർണ്ണതകൾ മനസ്സിലാക്കുന്നതിന് റാഫ്റ്റ് ഒരു അത്യന്താപേക്ഷിതമായ പടിയാണ്.

ആധുനിക ആർക്കിടെക്ചറുകളിൽ വികേന്ദ്രീകൃത സമവായത്തിന്റെ അത്യന്താപേക്ഷിതമായ ആവശ്യം

ഓരോ സെക്കൻഡിലും ദശലക്ഷക്കണക്കിന് ഇടപാടുകൾ കൈകാര്യം ചെയ്യുന്ന ഒരു ആഗോള ഇ-കൊമേഴ്‌സ് പ്ലാറ്റ്‌ഫോം സങ്കൽപ്പിക്കുക. ഉപഭോക്തൃ ഡാറ്റ, ഇൻവെന്ററി ലെവലുകൾ, ഓർഡർ നിലകൾ — ഇവയെല്ലാം ഭൂഖണ്ഡങ്ങളിലുടനീളമുള്ള നിരവധി ഡാറ്റാ സെന്ററുകളിൽ സ്ഥിരമായിരിക്കണം. ഒന്നിലധികം സെർവറുകളിൽ വ്യാപിച്ചുകിടക്കുന്ന ഒരു ബാങ്കിംഗ് സിസ്റ്റത്തിന്റെ ലെഡ്ജറിന് ഒരു അക്കൗണ്ട് ബാലൻസിനെക്കുറിച്ച് ഒരു നിമിഷത്തേക്കും വിയോജിപ്പുണ്ടാകാൻ കഴിയില്ല. ഈ സാഹചര്യങ്ങൾ വികേന്ദ്രീകൃത സമവായത്തിന്റെ നിർണായക പ്രാധാന്യം എടുത്തു കാണിക്കുന്നു.

വിതരണം ചെയ്ത സിസ്റ്റങ്ങളുടെ അന്തർലീനമായ വെല്ലുവിളികൾ

വിതരണം ചെയ്ത സിസ്റ്റങ്ങൾ, അവയുടെ സ്വഭാവം കാരണം, മൊണോലിത്തിക് ആപ്ലിക്കേഷനുകളിൽ ഇല്ലാത്ത നിരവധി വെല്ലുവിളികൾ അവതരിപ്പിക്കുന്നു. റാഫ്റ്റ് പോലുള്ള അൽഗോരിതങ്ങളുടെ മനോഹാരിതയും ആവശ്യകതയും വിലയിരുത്തുന്നതിന് ഈ വെല്ലുവിളികൾ മനസ്സിലാക്കേണ്ടത് നിർണായകമാണ്:

ഭാഗികമായ തകരാറുകൾ (Partial Failures): ഒരു സിംഗിൾ സെർവർ പൂർണ്ണമായി പ്രവർത്തിക്കുകയോ പൂർണ്ണമായി തകരുകയോ ചെയ്യുന്നതുപോലെ അല്ലാതെ, ഒരു വിതരണം ചെയ്ത സിസ്റ്റത്തിൽ ചില നോഡുകൾ പരാജയപ്പെടുമ്പോൾ മറ്റുള്ളവ തുടർന്നും പ്രവർത്തിച്ചേക്കാം. ഒരു സെർവർ തകരാറിലായേക്കാം, അതിന്റെ നെറ്റ്‌വർക്ക് കണക്ഷൻ വിച്ഛേദിക്കപ്പെട്ടേക്കാം, അല്ലെങ്കിൽ അതിന്റെ ഡിസ്ക് കേടായേക്കാം, അതേസമയം ക്ലസ്റ്ററിന്റെ മറ്റ് ഭാഗങ്ങൾ പ്രവർത്തനക്ഷമമായി തുടരും. ഈ ഭാഗികമായ തകരാറുകൾക്കിടയിലും സിസ്റ്റം ശരിയായി പ്രവർത്തിക്കണം.
നെറ്റ്‌വർക്ക് പാർട്ടീഷനുകൾ (Network Partitions): നോഡുകളെ ബന്ധിപ്പിക്കുന്ന നെറ്റ്‌വർക്ക് എല്ലായ്പ്പോഴും വിശ്വസനീയമായിരിക്കില്ല. നോഡുകളുടെ ഉപസെറ്റുകൾ തമ്മിലുള്ള ആശയവിനിമയം വിച്ഛേദിക്കപ്പെടുമ്പോൾ ഒരു നെറ്റ്‌വർക്ക് പാർട്ടീഷൻ സംഭവിക്കുന്നു. ഇത് ചില നോഡുകൾ പ്രവർത്തിക്കുന്നുണ്ടെങ്കിൽ പോലും പരാജയപ്പെട്ടതായി തോന്നാം. സിസ്റ്റത്തിന്റെ വിവിധ ഭാഗങ്ങൾ കാലഹരണപ്പെട്ടതോ പൊരുത്തമില്ലാത്തതോ ആയ വിവരങ്ങളെ അടിസ്ഥാനമാക്കി സ്വതന്ത്രമായി പ്രവർത്തിക്കുന്ന ഈ "സ്പ്ലിറ്റ്-ബ്രെയിൻ" സാഹചര്യങ്ങൾ പരിഹരിക്കുന്നത് ഒരു പ്രധാന സമവായ പ്രശ്നമാണ്.
അസമന്വിത ആശയവിനിമയം (Asynchronous Communication): നോഡുകൾക്കിടയിലുള്ള സന്ദേശങ്ങൾക്ക് കാലതാമസം നേരിടാം, ക്രമം തെറ്റാം, അല്ലെങ്കിൽ പൂർണ്ണമായി നഷ്ടപ്പെടാം. ഒരു ആഗോള ക്ലോക്കോ സന്ദേശ വിതരണ സമയങ്ങളെക്കുറിച്ചുള്ള ഉറപ്പോ ഇല്ലാത്തതിനാൽ, ഇവന്റുകളുടെ സ്ഥിരമായ ഒരു ക്രമം അല്ലെങ്കിൽ ഒരു നിശ്ചിത സിസ്റ്റം അവസ്ഥ സ്ഥാപിക്കുന്നത് ബുദ്ധിമുട്ടാണ്.
ഒരേസമയം നടക്കുന്ന പ്രവർത്തനങ്ങൾ (Concurrency): ഒന്നിലധികം നോഡുകൾ ഒരേ ഡാറ്റാ ഭാഗം അപ്ഡേറ്റ് ചെയ്യാനോ ഒരേസമയം പ്രവർത്തനങ്ങൾ ആരംഭിക്കാനോ ശ്രമിച്ചേക്കാം. ഈ പ്രവർത്തനങ്ങളെ ഏകോപിപ്പിക്കാനുള്ള ഒരു സംവിധാനം ഇല്ലെങ്കിൽ, വൈരുദ്ധ്യങ്ങളും പൊരുത്തക്കേടുകളും അനിവാര്യമാണ്.
പ്രവചനാതീതമായ കാലതാമസം (Unpredictable Latency): പ്രത്യേകിച്ച് ആഗോളതലത്തിൽ വിതരണം ചെയ്ത വിന്യാസങ്ങളിൽ, നെറ്റ്‌വർക്ക് ലേറ്റൻസിക്ക് ഗണ്യമായ വ്യത്യാസങ്ങൾ ഉണ്ടാകാം. ഒരു പ്രദേശത്ത് വേഗത്തിലുള്ള പ്രവർത്തനങ്ങൾ മറ്റൊരിടത്ത് സാവധാനത്തിലായിരിക്കാം, ഇത് തീരുമാനമെടുക്കൽ പ്രക്രിയകളെയും ഏകോപനത്തെയും ബാധിക്കുന്നു.

എന്തുകൊണ്ടാണ് സമവായം വിശ്വാസ്യതയുടെ അടിസ്ഥാനശിലയാകുന്നത്

ഈ വെല്ലുവിളികൾ പരിഹരിക്കുന്നതിനുള്ള ഒരു അടിസ്ഥാന നിർമ്മാണ ബ്ലോക്ക് സമവായ അൽഗോരിതങ്ങൾ നൽകുന്നു. വിശ്വസനീയമല്ലാത്ത ഘടകങ്ങളുടെ ഒരു ശേഖരത്തിന് ഒരൊറ്റ, അതീവ വിശ്വസനീയവും ഏകീകൃതവുമായ യൂണിറ്റായി കൂട്ടായി പ്രവർത്തിക്കാൻ അവ പ്രാപ്തമാക്കുന്നു. പ്രത്യേകിച്ചും, സമവായം താഴെ പറയുന്നവ നേടാൻ സഹായിക്കുന്നു:

സ്റ്റേറ്റ് മെഷീൻ റെപ്ലിക്കേഷൻ (SMR): പല തെറ്റ് സഹിക്കാൻ കഴിയുന്ന വിതരണം ചെയ്ത സിസ്റ്റങ്ങളുടെയും പ്രധാന ആശയം. എല്ലാ നോഡുകളും പ്രവർത്തനങ്ങളുടെ ക്രമത്തിൽ യോജിക്കുകയും, ഓരോ നോഡും ഒരേ പ്രാരംഭ അവസ്ഥയിൽ ആരംഭിക്കുകയും അതേ ക്രമത്തിൽ പ്രവർത്തനങ്ങൾ നടപ്പിലാക്കുകയും ചെയ്താൽ, എല്ലാ നോഡുകളും ഒരേ അന്തിമ അവസ്ഥയിൽ എത്തും. പ്രവർത്തനങ്ങളുടെ ഈ ആഗോള ക്രമത്തിൽ യോജിക്കാനുള്ള സംവിധാനമാണ് സമവായം.
ഉയർന്ന ലഭ്യത (High Availability): ഒരു സിസ്റ്റത്തിന് കുറഞ്ഞ എണ്ണം നോഡുകൾ തകരാറിലായാലും പ്രവർത്തിക്കാൻ അനുവദിക്കുന്നതിലൂടെ, സമവായം സേവനങ്ങൾ ലഭ്യവും പ്രവർത്തനക്ഷമവുമായി തുടരുന്നുവെന്ന് ഉറപ്പാക്കുന്നു, പ്രവർത്തനരഹിതമായ സമയം കുറയ്ക്കുന്നു.
ഡാറ്റാ സ്ഥിരത (Data Consistency): ഡാറ്റയുടെ എല്ലാ പകർപ്പുകളും സമന്വയിപ്പിച്ച് നിലനിർത്തുന്നുവെന്ന് ഇത് ഉറപ്പാക്കുന്നു, പരസ്പരവിരുദ്ധമായ അപ്‌ഡേറ്റുകൾ തടയുകയും ക്ലയന്റുകൾ എല്ലായ്പ്പോഴും ഏറ്റവും പുതിയതും ശരിയായതുമായ വിവരങ്ങൾ വായിക്കുന്നുവെന്ന് ഉറപ്പാക്കുകയും ചെയ്യുന്നു.
തെറ്റ് സഹിക്കാനുള്ള കഴിവ് (Fault Tolerance): സിസ്റ്റത്തിന് ഒരു നിശ്ചിത എണ്ണം നോഡ് തകരാറുകൾ (സാധാരണയായി ക്രാഷ് തകരാറുകൾ) സഹിക്കാനും മനുഷ്യന്റെ ഇടപെടൽ കൂടാതെ മുന്നോട്ട് പോകാനും കഴിയും.

റാഫ്റ്റ് അവതരിപ്പിക്കുന്നു: സമവായത്തിലേക്കുള്ള എളുപ്പത്തിൽ മനസ്സിലാക്കാവുന്ന ഒരു സമീപനം

വിതരണം ചെയ്ത സമവായം എളുപ്പത്തിൽ മനസ്സിലാക്കാൻ കഴിയുന്നതാക്കുക എന്ന വ്യക്തമായ ലക്ഷ്യത്തോടെയാണ് റാഫ്റ്റ് അക്കാദമിക് ലോകത്ത് നിന്ന് ഉയർന്നുവന്നത്. ഇതിന്റെ രചയിതാക്കളായ ഡീഗോ ഓംഗാരോയും ജോൺ ഓസ്റ്റർഹൗട്ടും, സമവായ അൽഗോരിതങ്ങളുടെ വ്യാപകമായ ദത്തെടുക്കലും ശരിയായ നടപ്പിലാക്കലും സാധ്യമാക്കുക എന്ന ലക്ഷ്യത്തോടെ, റാഫ്റ്റിനെ മനസ്സിലാക്കാനുള്ള എളുപ്പത്തിനായി പ്രത്യേകം രൂപകൽപ്പന ചെയ്തു.

റാഫ്റ്റിന്റെ പ്രധാന ഡിസൈൻ തത്വശാസ്ത്രം: മനസ്സിലാക്കാനുള്ള എളുപ്പം ആദ്യം

റാഫ്റ്റ്, സമവായത്തിന്റെ സങ്കീർണ്ണമായ പ്രശ്നത്തെ, ഓരോന്നിനും അതിൻ്റേതായ നിയമങ്ങളും സ്വഭാവങ്ങളുമുള്ള, താരതമ്യേന സ്വതന്ത്രമായ നിരവധി ഉപപ്രശ്നങ്ങളായി വിഭജിക്കുന്നു. ഈ മൊഡുലാരിറ്റി മനസ്സിലാക്കാൻ കാര്യമായ സഹായം നൽകുന്നു. പ്രധാന ഡിസൈൻ തത്വങ്ങളിൽ താഴെ പറയുന്നവ ഉൾപ്പെടുന്നു:

ലീഡർ കേന്ദ്രീകൃത സമീപനം (Leader-Centric Approach): എല്ലാ നോഡുകളും തീരുമാനമെടുക്കുന്നതിൽ തുല്യമായി പങ്കെടുക്കുന്ന മറ്റ് ചില സമവായ അൽഗോരിതങ്ങളിൽ നിന്ന് വ്യത്യസ്തമായി, റാഫ്റ്റ് ഒരു സിംഗിൾ ലീഡറിനെ നിർദ്ദേശിക്കുന്നു. റെപ്ലിക്കേറ്റ് ചെയ്ത ലോഗ് കൈകാര്യം ചെയ്യുന്നതിനും എല്ലാ ക്ലയന്റ് അഭ്യർത്ഥനകളും ഏകോപിപ്പിക്കുന്നതിനും ലീഡർക്ക് ഉത്തരവാദിത്തമുണ്ട്. ഇത് ലോഗ് മാനേജ്മെന്റ് ലളിതമാക്കുകയും നോഡുകൾ തമ്മിലുള്ള ഇടപെടലുകളുടെ സങ്കീർണ്ണത കുറയ്ക്കുകയും ചെയ്യുന്നു.
ശക്തനായ ലീഡർ (Strong Leader): പുതിയ ലോഗ് എൻട്രികൾ നിർദ്ദേശിക്കുന്നതിനും അവ എപ്പോൾ കമ്മിറ്റ് ചെയ്യണം എന്ന് തീരുമാനിക്കുന്നതിനും ലീഡർക്ക് അന്തിമ അധികാരമുണ്ട്. ഫോളോവർമാർ ലീഡറുടെ ലോഗ് നിഷ്ക്രിയമായി റെപ്ലിക്കേറ്റ് ചെയ്യുകയും ലീഡറുടെ അഭ്യർത്ഥനകളോട് പ്രതികരിക്കുകയും ചെയ്യുന്നു.
നിശ്ചിത ഇലക്ഷനുകൾ (Deterministic Elections): ഒരു പ്രത്യേക ഇലക്ഷൻ ടേമിൽ സാധാരണയായി ഒരു കാൻഡിഡേറ്റ് മാത്രമേ ലീഡറായി ഉയർന്നുവരുന്നുള്ളൂ എന്ന് ഉറപ്പാക്കാൻ റാഫ്റ്റ് റാൻഡമൈസ്ഡ് ഇലക്ഷൻ ടൈംഔട്ട് ഉപയോഗിക്കുന്നു.
ലോഗ് സ്ഥിരത (Log Consistency): റാഫ്റ്റ് അതിന്റെ റെപ്ലിക്കേറ്റ് ചെയ്ത ലോഗിൽ ശക്തമായ സ്ഥിരതാ ഗുണങ്ങൾ നടപ്പിലാക്കുന്നു, കമ്മിറ്റ് ചെയ്ത എൻട്രികൾ ഒരിക്കലും മാറ്റിവയ്ക്കില്ലെന്നും എല്ലാ കമ്മിറ്റ് ചെയ്ത എൻട്രികളും ലഭ്യമായ എല്ലാ നോഡുകളിലും最终മായി ദൃശ്യമാകുമെന്നും ഉറപ്പാക്കുന്നു.

പാക്സോസുമായുള്ള ഒരു ചെറിയ താരതമ്യം

റാഫ്റ്റിന് മുൻപ്, വിതരണം ചെയ്ത സമവായത്തിനുള്ള യഥാർത്ഥ സ്റ്റാൻഡേർഡ് പാക്സോസ് ആയിരുന്നു. ശക്തമാണെങ്കിലും, പാക്സോസ് മനസ്സിലാക്കാനും ശരിയായി നടപ്പിലാക്കാനും വളരെ ബുദ്ധിമുട്ടാണെന്ന് അറിയപ്പെടുന്നു. അതിന്റെ രൂപകൽപ്പന, റോളുകളെ (നിർദ്ദേശകൻ, സ്വീകർത്താവ്, പഠിതാവ്) വേർതിരിക്കുകയും ഒന്നിലധികം നേതാക്കൾക്ക് ഒരേസമയം നിലനിൽക്കാൻ അനുവദിക്കുകയും ചെയ്യുന്നതിനാൽ (ഒന്നിന് മാത്രമേ ഒരു മൂല്യം കമ്മിറ്റ് ചെയ്യാൻ കഴിയൂ), സങ്കീർണ്ണമായ ഇടപെടലുകളിലേക്കും എഡ്ജ് കേസുകളിലേക്കും നയിച്ചേക്കാം.

റാഫ്റ്റ്, ഇതിന് വിപരീതമായി, സ്റ്റേറ്റ് സ്പേസിനെ ലളിതമാക്കുന്നു. ഇത് ഒരു ശക്തമായ ലീഡർ മോഡൽ നടപ്പിലാക്കുന്നു, അവിടെ ലോഗിലെ എല്ലാ മാറ്റങ്ങൾക്കും ലീഡർക്ക് ഉത്തരവാദിത്തമുണ്ട്. ഇത് റോളുകളും (ലീഡർ, ഫോളോവർ, കാൻഡിഡേറ്റ്) അവ തമ്മിലുള്ള മാറ്റങ്ങളും വ്യക്തമായി നിർവചിക്കുന്നു. ഈ ഘടന റാഫ്റ്റിന്റെ സ്വഭാവം കൂടുതൽ അവബോധപരവും ന്യായീകരിക്കാൻ എളുപ്പമുള്ളതുമാക്കുന്നു, ഇത് നടപ്പിലാക്കലിലെ ബഗുകൾ കുറയ്ക്കാനും വേഗത്തിലുള്ള വികസന സൈക്കിളുകളിലേക്കും നയിക്കുന്നു. പാക്സോസുമായി ആദ്യം ബുദ്ധിമുട്ടിയ പല യഥാർത്ഥ ലോക സിസ്റ്റങ്ങളും റാഫ്റ്റ് സ്വീകരിച്ചതിലൂടെ വിജയം കണ്ടെത്തിയിട്ടുണ്ട്.

റാഫ്റ്റിലെ മൂന്ന് അടിസ്ഥാന റോളുകൾ

ഏത് സമയത്തും, ഒരു റാഫ്റ്റ് ക്ലസ്റ്ററിലെ ഓരോ സെർവറും മൂന്ന് അവസ്ഥകളിൽ ഒന്നിലായിരിക്കും: ലീഡർ (Leader), ഫോളോവർ (Follower), അല്ലെങ്കിൽ കാൻഡിഡേറ്റ് (Candidate). ഈ റോളുകൾ എക്സ്ക്ലൂസീവും ഡൈനാമിക്കുമാണ്, പ്രത്യേക നിയമങ്ങളെയും സംഭവങ്ങളെയും അടിസ്ഥാനമാക്കി സെർവറുകൾ അവയ്ക്കിടയിൽ മാറുന്നു.

1. ഫോളോവർ (Follower)

നിഷ്ക്രിയ പങ്ക് (Passive Role): റാഫ്റ്റിലെ ഏറ്റവും നിഷ്ക്രിയമായ അവസ്ഥയാണ് ഫോളോവർമാർ. അവർ ലീഡർമാരുടെയും കാൻഡിഡേറ്റുകളുടെയും അഭ്യർത്ഥനകളോട് പ്രതികരിക്കുക മാത്രം ചെയ്യുന്നു.
ഹാർട്ട്ബീറ്റുകൾ സ്വീകരിക്കുന്നു (Receiving Heartbeats): ഒരു ഫോളോവർ ലീഡറിൽ നിന്ന് പതിവ് ഇടവേളകളിൽ ഹാർട്ട്ബീറ്റുകൾ (ഒഴിഞ്ഞ അപ്പെൻഡ് എൻട്രീസ് RPC-കൾ) ലഭിക്കുമെന്ന് പ്രതീക്ഷിക്കുന്നു. ഒരു നിശ്ചിത election timeout കാലയളവിനുള്ളിൽ ഒരു ഫോളോവർക്ക് ഹാർട്ട്ബീറ്റോ അപ്പെൻഡ് എൻട്രീസ് RPC-യോ ലഭിച്ചില്ലെങ്കിൽ, ലീഡർക്ക് തകരാർ സംഭവിച്ചുവെന്ന് അത് അനുമാനിക്കുകയും ഒരു കാൻഡിഡേറ്റ് അവസ്ഥയിലേക്ക് മാറുകയും ചെയ്യുന്നു.
വോട്ടുചെയ്യൽ (Voting): ഒരു തിരഞ്ഞെടുപ്പിൽ, ഒരു ഫോളോവർ ഓരോ ടേമിലും പരമാവധി ഒരു കാൻഡിഡേറ്റിന് വോട്ടുചെയ്യും.
ലോഗ് റെപ്ലിക്കേഷൻ (Log Replication): ലീഡർ നിർദ്ദേശിക്കുന്നതനുസരിച്ച് ഫോളോവർമാർ അവരുടെ ലോക്കൽ ലോഗിലേക്ക് ലോഗ് എൻട്രികൾ ചേർക്കുന്നു.

2. കാൻഡിഡേറ്റ് (Candidate)

തിരഞ്ഞെടുപ്പുകൾ ആരംഭിക്കുന്നു (Initiating Elections): ഒരു ഫോളോവറിന് സമയം കഴിയുമ്പോൾ (ലീഡറിൽ നിന്ന് കേൾക്കാത്തപ്പോൾ), അത് ഒരു പുതിയ തിരഞ്ഞെടുപ്പ് ആരംഭിക്കാൻ കാൻഡിഡേറ്റ് അവസ്ഥയിലേക്ക് മാറുന്നു.
സ്വയം വോട്ടുചെയ്യൽ (Self-Voting): ഒരു കാൻഡിഡേറ്റ് അതിന്റെ current term വർദ്ധിപ്പിക്കുകയും, സ്വയം വോട്ടുചെയ്യുകയും, ക്ലസ്റ്ററിലെ മറ്റ് എല്ലാ സെർവറുകളിലേക്കും RequestVote RPC-കൾ അയക്കുകയും ചെയ്യുന്നു.
ഒരു തിരഞ്ഞെടുപ്പിൽ വിജയിക്കുന്നു (Winning an Election): ഒരു കാൻഡിഡേറ്റിന് അതേ ടേമിൽ ക്ലസ്റ്ററിലെ ഭൂരിപക്ഷം സെർവറുകളിൽ നിന്ന് വോട്ടുകൾ ലഭിക്കുകയാണെങ്കിൽ, അത് ലീഡർ അവസ്ഥയിലേക്ക് മാറുന്നു.
സ്ഥാനം ഒഴിയുന്നു (Stepping Down): ഒരു കാൻഡിഡേറ്റ് ഉയർന്ന ടേം ഉള്ള മറ്റൊരു സെർവറിനെ കണ്ടെത്തുകയാണെങ്കിൽ, അല്ലെങ്കിൽ ഒരു നിയമപരമായ ലീഡറിൽ നിന്ന് ഒരു AppendEntries RPC ലഭിക്കുകയാണെങ്കിൽ, അത് ഒരു ഫോളോവർ അവസ്ഥയിലേക്ക് മടങ്ങുന്നു.

3. ലീഡർ (Leader)

ഏക അധികാരകേന്ദ്രം (Sole Authority): ഒരു റാഫ്റ്റ് ക്ലസ്റ്ററിൽ ഒരു നിശ്ചിത സമയത്ത് (ഒരു പ്രത്യേക ടേമിന്) ഒരു ലീഡർ മാത്രമേ ഉണ്ടാകൂ. എല്ലാ ക്ലയന്റ് ഇടപെടലുകൾക്കും, ലോഗ് റെപ്ലിക്കേഷനും, സ്ഥിരത ഉറപ്പാക്കുന്നതിനും ലീഡർക്ക് ഉത്തരവാദിത്തമുണ്ട്.
ഹാർട്ട്ബീറ്റുകൾ അയക്കുന്നു (Sending Heartbeats): ലീഡർ പുതിയ തിരഞ്ഞെടുപ്പുകൾ തടയുന്നതിനും അതിന്റെ അധികാരം നിലനിർത്തുന്നതിനും എല്ലാ ഫോളോവർമാർക്കും ആവർത്തിച്ച് AppendEntries RPC-കൾ (ഹാർട്ട്ബീറ്റുകൾ) അയക്കുന്നു.
ലോഗ് മാനേജ്മെന്റ് (Log Management): ലീഡർ ക്ലയന്റ് അഭ്യർത്ഥനകൾ സ്വീകരിക്കുകയും പുതിയ ലോഗ് എൻട്രികൾ അതിന്റെ ലോക്കൽ ലോഗിലേക്ക് ചേർക്കുകയും തുടർന്ന് ഈ എൻട്രികൾ എല്ലാ ഫോളോവർമാർക്കും റെപ്ലിക്കേറ്റ് ചെയ്യുകയും ചെയ്യുന്നു.
കമ്മിറ്റ്മെന്റ് (Commitment): ഒരു എൻട്രി ഭൂരിപക്ഷം സെർവറുകളിലേക്ക് സുരക്ഷിതമായി റെപ്ലിക്കേറ്റ് ചെയ്യപ്പെടുകയും സ്റ്റേറ്റ് മെഷീനിൽ കമ്മിറ്റ് ചെയ്യാൻ കഴിയുകയും ചെയ്യുമ്പോൾ ലീഡർ തീരുമാനിക്കുന്നു.
സ്ഥാനം ഒഴിയുന്നു (Stepping Down): ലീഡർക്ക് ഉയർന്ന term ഉള്ള ഒരു സെർവറിനെ കണ്ടെത്തുകയാണെങ്കിൽ, അത് ഉടനടി സ്ഥാനം ഒഴിയുകയും ഒരു ഫോളോവറായി മാറുകയും ചെയ്യുന്നു. സിസ്റ്റം എല്ലായ്പ്പോഴും അറിയപ്പെടുന്ന ഏറ്റവും ഉയർന്ന ടേമിനൊപ്പം മുന്നോട്ട് പോകുന്നുവെന്ന് ഇത് ഉറപ്പാക്കുന്നു.

റാഫ്റ്റിന്റെ പ്രവർത്തന ഘട്ടങ്ങൾ: ഒരു വിശദമായ വിശകലനം

ലീഡർ തിരഞ്ഞെടുപ്പിന്റെയും ലോഗ് റെപ്ലിക്കേഷന്റെയും തുടർച്ചയായ ഒരു സൈക്കിളിലൂടെയാണ് റാഫ്റ്റ് പ്രവർത്തിക്കുന്നത്. ഈ രണ്ട് പ്രാഥമിക സംവിധാനങ്ങൾ, നിർണായകമായ സുരക്ഷാ സവിശേഷതകൾക്കൊപ്പം, ക്ലസ്റ്റർ സ്ഥിരതയും തകരാറുകൾ സഹിക്കാനുള്ള കഴിവും നിലനിർത്തുന്നുവെന്ന് ഉറപ്പാക്കുന്നു.

1. ലീഡർ തിരഞ്ഞെടുപ്പ് (Leader Election)

ക്ലസ്റ്ററിന് പ്രവർത്തനങ്ങളെ ഏകോപിപ്പിക്കാൻ എല്ലായ്പ്പോഴും ഒരു സിംഗിൾ, ആധികാരിക നോഡ് ഉണ്ടെന്ന് ഉറപ്പാക്കുന്നതിന് ലീഡർ തിരഞ്ഞെടുപ്പ് പ്രക്രിയ റാഫ്റ്റിന്റെ പ്രവർത്തനത്തിന് അടിസ്ഥാനപരമാണ്.

തിരഞ്ഞെടുപ്പ് കാലതാമസം (Election Timeout): ഓരോ ഫോളോവറും ക്രമരഹിതമായ ഒരു election timeout (സാധാരണയായി 150-300ms) നിലനിർത്തുന്നു. ഈ കാലയളവിനുള്ളിൽ നിലവിലെ ലീഡറിൽ നിന്ന് ഒരു ഫോളോവർക്ക് ആശയവിനിമയം (ഹാർട്ട്ബീറ്റ് അല്ലെങ്കിൽ AppendEntries RPC) ലഭിക്കുന്നില്ലെങ്കിൽ, ലീഡർക്ക് തകരാർ സംഭവിച്ചുവെന്ന് അല്ലെങ്കിൽ ഒരു നെറ്റ്‌വർക്ക് പാർട്ടീഷൻ സംഭവിച്ചുവെന്ന് അത് അനുമാനിക്കുന്നു.
കാൻഡിഡേറ്റ് അവസ്ഥയിലേക്കുള്ള മാറ്റം (Transition to Candidate): സമയം കഴിയുമ്പോൾ, ഫോളോവർ Candidate അവസ്ഥയിലേക്ക് മാറുന്നു. ഇത് അതിന്റെ current term വർദ്ധിപ്പിക്കുകയും, സ്വയം വോട്ടുചെയ്യുകയും, അതിന്റെ തിരഞ്ഞെടുപ്പ് ടൈമർ പുനഃസജ്ജമാക്കുകയും ചെയ്യുന്നു.
RequestVote RPC: തുടർന്ന് കാൻഡിഡേറ്റ് ക്ലസ്റ്ററിലെ മറ്റ് എല്ലാ സെർവറുകളിലേക്കും RequestVote RPC-കൾ അയക്കുന്നു. ഈ RPC-ൽ കാൻഡിഡേറ്റിന്റെ current term, അതിന്റെ candidateId, അതിന്റെ last log index, last log term എന്നിവയെക്കുറിച്ചുള്ള വിവരങ്ങളും ഉൾപ്പെടുന്നു (പിന്നീട് സുരക്ഷയ്ക്ക് ഇത് എന്തുകൊണ്ടാണ് നിർണായകമെന്ന് വിശദീകരിക്കും).
വോട്ടുചെയ്യാനുള്ള നിയമങ്ങൾ (Voting Rules): ഒരു സെർവർ ഒരു കാൻഡിഡേറ്റിന് വോട്ട് നൽകും, താഴെ പറയുന്നവയാണെങ്കിൽ:
1. അതിന്റെ current term കാൻഡിഡേറ്റിന്റെ ടേമിനേക്കാൾ കുറവോ തുല്യമോ ആണെങ്കിൽ.
2. ഈ ടേമിൽ അത് മറ്റൊരു കാൻഡിഡേറ്റിന് വോട്ട് ചെയ്തിട്ടില്ലെങ്കിൽ.
3. കാൻഡിഡേറ്റിന്റെ ലോഗ് അതിൻ്റേതിനേക്കാൾ കാലികമാണെങ്കിൽ. ഇത് ആദ്യം last log term താരതമ്യം ചെയ്തും, ടേമുകൾ സമാനമാണെങ്കിൽ last log index താരതമ്യം ചെയ്തും നിർണ്ണയിക്കപ്പെടുന്നു. വോട്ടർമാരുടെ ലോഗിൽ അടങ്ങിയിരിക്കുന്ന എല്ലാ കമ്മിറ്റ് ചെയ്ത എൻട്രികളും കാൻഡിഡേറ്റിന്റെ ലോഗിൽ ഉണ്ടെങ്കിൽ ഒരു കാൻഡിഡേറ്റ് "കാലികമായതാണ്". ഇത് തിരഞ്ഞെടുപ്പ് നിയന്ത്രണം (election restriction) എന്നറിയപ്പെടുന്നു, ഇത് സുരക്ഷയ്ക്ക് നിർണായകമാണ്.
തിരഞ്ഞെടുപ്പിൽ വിജയിക്കുന്നു (Winning the Election): ഒരു കാൻഡിഡേറ്റിന് അതേ ടേമിൽ ക്ലസ്റ്ററിലെ ഭൂരിപക്ഷം സെർവറുകളിൽ നിന്ന് വോട്ടുകൾ ലഭിച്ചാൽ, അത് പുതിയ ലീഡറായി മാറുന്നു. തിരഞ്ഞെടുക്കപ്പെട്ടുകഴിഞ്ഞാൽ, പുതിയ ലീഡർ അതിന്റെ അധികാരം സ്ഥാപിക്കുന്നതിനും പുതിയ തിരഞ്ഞെടുപ്പുകൾ തടയുന്നതിനും മറ്റ് എല്ലാ സെർവറുകളിലേക്കും ഉടനടി AppendEntries RPC-കൾ (ഹാർട്ട്ബീറ്റുകൾ) അയക്കുന്നു.
വോട്ട് പിളരലും വീണ്ടും ശ്രമിക്കലും (Split Votes and Retries): ഒരേസമയം ഒന്നിലധികം കാൻഡിഡേറ്റുകൾ ഉയർന്നുവരികയും ഭൂരിപക്ഷം വോട്ട് ഒരു കാൻഡിഡേറ്റിനും ലഭിക്കാതെ വോട്ട് പിളരുകയും ചെയ്യുന്നത് സാധ്യമാണ്. ഇത് പരിഹരിക്കുന്നതിന്, ഓരോ കാൻഡിഡേറ്റിനും ക്രമരഹിതമായ തിരഞ്ഞെടുപ്പ് കാലയളവ് ഉണ്ട്. ഒരു കാൻഡിഡേറ്റിന്റെ കാലയളവ് അവസാനിച്ചിട്ടും തിരഞ്ഞെടുപ്പിൽ വിജയിക്കുകയോ ഒരു പുതിയ ലീഡറിൽ നിന്ന് കേൾക്കുകയോ ചെയ്യുന്നില്ലെങ്കിൽ, അത് അതിന്റെ ടേം വർദ്ധിപ്പിക്കുകയും ഒരു പുതിയ തിരഞ്ഞെടുപ്പ് ആരംഭിക്കുകയും ചെയ്യുന്നു. ഈ ക്രമരഹിതത്വം വോട്ട് പിളരലുകൾ അപൂർവ്വമാണെന്നും വേഗത്തിൽ പരിഹരിക്കപ്പെടുമെന്നും ഉറപ്പാക്കാൻ സഹായിക്കുന്നു.
ഉയർന്ന ടേമുകൾ കണ്ടെത്തുന്നു (Discovering Higher Terms): ഒരു കാൻഡിഡേറ്റിന് (അല്ലെങ്കിൽ ഏതെങ്കിലും സെർവറിന്) അതിന്റേതിനേക്കാൾ ഉയർന്ന term ഉള്ള ഒരു RPC ലഭിക്കുകയാണെങ്കിൽ, അത് ഉടനടി അതിന്റെ current term ഉയർന്ന മൂല്യത്തിലേക്ക് അപ്ഡേറ്റ് ചെയ്യുകയും follower അവസ്ഥയിലേക്ക് മടങ്ങുകയും ചെയ്യുന്നു. കാലഹരണപ്പെട്ട വിവരങ്ങളുള്ള ഒരു സെർവർ ഒരിക്കലും ലീഡറാകാനോ ഒരു നിയമപരമായ ലീഡറിനെ തടസ്സപ്പെടുത്താനോ ശ്രമിക്കുന്നില്ലെന്ന് ഇത് ഉറപ്പാക്കുന്നു.

2. ലോഗ് റെപ്ലിക്കേഷൻ (Log Replication)

ഒരു ലീഡറിനെ തിരഞ്ഞെടുത്ത് കഴിഞ്ഞാൽ, അതിന്റെ പ്രാഥമിക ഉത്തരവാദിത്തം റെപ്ലിക്കേറ്റ് ചെയ്ത ലോഗ് കൈകാര്യം ചെയ്യുകയും ക്ലസ്റ്ററിലുടനീളം സ്ഥിരത ഉറപ്പാക്കുകയുമാണ്. ഇതിൽ ക്ലയന്റ് കമാൻഡുകൾ സ്വീകരിക്കുക, അവ അതിന്റെ ലോഗിലേക്ക് ചേർക്കുക, ഫോളോവർമാർക്ക് റെപ്ലിക്കേറ്റ് ചെയ്യുക എന്നിവ ഉൾപ്പെടുന്നു.

ക്ലയന്റ് അഭ്യർത്ഥനകൾ (Client Requests): എല്ലാ ക്ലയന്റ് അഭ്യർത്ഥനകളും (സ്റ്റേറ്റ് മെഷീൻ എക്സിക്യൂട്ട് ചെയ്യേണ്ട കമാൻഡുകൾ) ലീഡറിലേക്ക് നയിക്കപ്പെടുന്നു. ഒരു ക്ലയന്റ് ഒരു ഫോളോവറിനെ ബന്ധപ്പെടുകയാണെങ്കിൽ, ഫോളോവർ അഭ്യർത്ഥന നിലവിലെ ലീഡറിലേക്ക് റീഡയറക്ട് ചെയ്യുന്നു.
ലീഡറുടെ ലോഗിലേക്ക് ചേർക്കുന്നു (Appending to Leader's Log): ലീഡറിന് ഒരു ക്ലയന്റ് കമാൻഡ് ലഭിക്കുമ്പോൾ, അത് കമാൻഡിനെ ഒരു പുതിയ log entry ആയി അതിന്റെ ലോക്കൽ ലോഗിലേക്ക് ചേർക്കുന്നു. ഓരോ ലോഗ് എൻട്രിയും കമാൻഡ് തന്നെ, അത് ലഭിച്ച term, അതിന്റെ log index എന്നിവ ഉൾക്കൊള്ളുന്നു.
AppendEntries RPC: ലീഡർ തുടർന്ന് എല്ലാ ഫോളോവർമാർക്കും AppendEntries RPC-കൾ അയയ്ക്കുന്നു, അവരോട് പുതിയ ലോഗ് എൻട്രി (അല്ലെങ്കിൽ ഒരു കൂട്ടം എൻട്രികൾ) അവരുടെ ലോഗുകളിലേക്ക് ചേർക്കാൻ ആവശ്യപ്പെടുന്നു. ഈ RPC-കളിൽ താഴെ പറയുന്നവ ഉൾപ്പെടുന്നു:
- term: ലീഡറിന്റെ നിലവിലെ ടേം.
- leaderId: ലീഡറിന്റെ ID (ക്ലയന്റുകളെ റീഡയറക്ട് ചെയ്യുന്നതിന് ഫോളോവർമാർക്ക്).
- prevLogIndex: പുതിയ എൻട്രികൾക്ക് തൊട്ടുമുമ്പുള്ള ലോഗ് എൻട്രിയുടെ ഇൻഡെക്സ്.
- prevLogTerm: prevLogIndex എൻട്രിയുടെ ടേം. ഈ രണ്ട് (prevLogIndex, prevLogTerm) ലോഗ് മാച്ചിംഗ് പ്രോപ്പർട്ടിക്ക് നിർണായകമാണ്.
- entries[]: സംഭരിക്കാനുള്ള ലോഗ് എൻട്രികൾ (ഹാർട്ട്ബീറ്റുകൾക്ക് ഒഴിഞ്ഞത്).
- leaderCommit: ലീഡറിന്റെ commitIndex (കമ്മിറ്റ് ചെയ്തുവെന്ന് അറിയുന്ന ഏറ്റവും ഉയർന്ന ലോഗ് എൻട്രിയുടെ ഇൻഡെക്സ്).
സ്ഥിരതാ പരിശോധന (Consistency Check (Log Matching Property)): ഒരു ഫോളോവർ ഒരു AppendEntries RPC സ്വീകരിക്കുമ്പോൾ, അത് ഒരു സ്ഥിരതാ പരിശോധന നടത്തുന്നു. അതിന്റെ ലോഗിൽ prevLogIndex-ൽ prevLogTerm-മായി പൊരുത്തപ്പെടുന്ന ടേം ഉള്ള ഒരു എൻട്രി ഉണ്ടോ എന്ന് ഇത് പരിശോധിക്കുന്നു. ഈ പരിശോധന പരാജയപ്പെട്ടാൽ, ഫോളോവർ AppendEntries RPC നിരസിക്കുകയും അതിന്റെ ലോഗ് പൊരുത്തപ്പെടുന്നില്ലെന്ന് ലീഡറിനെ അറിയിക്കുകയും ചെയ്യുന്നു.
പൊരുത്തക്കേടുകൾ പരിഹരിക്കുന്നു (Resolving Inconsistencies): ഒരു ഫോളോവർ ഒരു AppendEntries RPC നിരസിച്ചാൽ, ലീഡർ ആ ഫോളോവറിനായുള്ള nextIndex കുറയ്ക്കുകയും AppendEntries RPC വീണ്ടും ശ്രമിക്കുകയും ചെയ്യുന്നു. nextIndex എന്നത് ഒരു പ്രത്യേക ഫോളോവറിലേക്ക് ലീഡർ അയയ്ക്കുന്ന അടുത്ത ലോഗ് എൻട്രിയുടെ ഇൻഡെക്സ് ആണ്. ലീഡറിന്റെയും ഫോളോവറിന്റെയും ലോഗുകൾ പൊരുത്തപ്പെടുന്ന ഒരു ഘട്ടത്തിൽ nextIndex എത്തുന്നത് വരെ ഈ പ്രക്രിയ തുടരുന്നു. ഒരു പൊരുത്തം കണ്ടെത്തിക്കഴിഞ്ഞാൽ, ഫോളോവർക്ക് തുടർന്നുള്ള ലോഗ് എൻട്രികൾ സ്വീകരിക്കാൻ കഴിയും, ഇത് അതിന്റെ ലോഗിനെ ലീഡറിൻ്റേതുമായി സ്ഥിരതയുള്ളതാക്കുന്നു.
എൻട്രികൾ കമ്മിറ്റ് ചെയ്യുന്നു (Committing Entries): ഒരു എൻട്രി, ലീഡർ അത് ഭൂരിപക്ഷം സെർവറുകളിലേക്ക് (സ്വയം ഉൾപ്പെടെ) വിജയകരമായി റെപ്ലിക്കേറ്റ് ചെയ്യുമ്പോൾ കമ്മിറ്റ് ചെയ്തതായി കണക്കാക്കപ്പെടുന്നു. കമ്മിറ്റ് ചെയ്തു കഴിഞ്ഞാൽ, എൻട്രി ലോക്കൽ സ്റ്റേറ്റ് മെഷീനിലേക്ക് പ്രയോഗിക്കാൻ കഴിയും. ലീഡർ അതിന്റെ commitIndex അപ്ഡേറ്റ് ചെയ്യുകയും കമ്മിറ്റ് ചെയ്ത എൻട്രികളെക്കുറിച്ച് ഫോളോവർമാരെ അറിയിക്കുന്നതിന് തുടർന്നുള്ള AppendEntries RPC-കളിൽ ഇത് ഉൾപ്പെടുത്തുകയും ചെയ്യുന്നു. ഫോളോവർമാർ ലീഡറിന്റെ leaderCommit അടിസ്ഥാനമാക്കി അവരുടെ commitIndex അപ്ഡേറ്റ് ചെയ്യുകയും ആ ഇൻഡെക്സ് വരെയുള്ള എൻട്രികൾ അവരുടെ സ്റ്റേറ്റ് മെഷീനിലേക്ക് പ്രയോഗിക്കുകയും ചെയ്യുന്നു.
ലീഡർ പൂർണ്ണതാ സവിശേഷത (Leader Completeness Property): ഒരു ലോഗ് എൻട്രി ഒരു നിശ്ചിത ടേമിൽ കമ്മിറ്റ് ചെയ്യപ്പെട്ടാൽ, തുടർന്നുള്ള എല്ലാ ലീഡർമാർക്കും ആ ലോഗ് എൻട്രി ഉണ്ടായിരിക്കുമെന്ന് റാഫ്റ്റ് ഉറപ്പാക്കുന്നു. തിരഞ്ഞെടുപ്പ് നിയന്ത്രണം ഈ സവിശേഷത നടപ്പിലാക്കുന്നു: ഒരു കാൻഡിഡേറ്റിന് അതിന്റെ ലോഗ് ഭൂരിപക്ഷം മറ്റ് സെർവറുകളുടേതിന് സമാനമായോ അതിലേറെയോ കാലികമാണെങ്കിൽ മാത്രമേ തിരഞ്ഞെടുപ്പിൽ വിജയിക്കാൻ കഴിയൂ. ഇത് കമ്മിറ്റ് ചെയ്ത എൻട്രികൾ മാറ്റിയെഴുതാനോ നഷ്ടപ്പെടുത്താനോ സാധ്യതയുള്ള ഒരു ലീഡറിനെ തിരഞ്ഞെടുക്കുന്നത് തടയുന്നു.

3. സുരക്ഷാ സവിശേഷതകളും ഉറപ്പുകളും (Safety Properties and Guarantees)

റാഫ്റ്റിന്റെ കരുത്ത്, പൊരുത്തക്കേടുകൾ തടയുന്നതിനും ഡാറ്റാ സമഗ്രത ഉറപ്പാക്കുന്നതിനും ശ്രദ്ധാപൂർവ്വം രൂപകൽപ്പന ചെയ്ത നിരവധി സുരക്ഷാ സവിശേഷതകളിൽ നിന്നാണ്:

തിരഞ്ഞെടുപ്പ് സുരക്ഷ (Election Safety): ഒരു നിശ്ചിത ടേമിൽ പരമാവധി ഒരു ലീഡറിനെ മാത്രമേ തിരഞ്ഞെടുക്കാൻ കഴിയൂ. ഒരു ഫോളോവർ ഓരോ ടേമിലും പരമാവധി ഒരു വോട്ട് നൽകുകയും ഒരു കാൻഡിഡേറ്റിന് ഭൂരിപക്ഷം വോട്ടുകൾ ആവശ്യമായി വരികയും ചെയ്യുന്ന വോട്ടിംഗ് സംവിധാനം ഇത് നടപ്പിലാക്കുന്നു.
ലീഡർ പൂർണ്ണത (Leader Completeness): ഒരു ലോഗ് എൻട്രി ഒരു നിശ്ചിത ടേമിൽ കമ്മിറ്റ് ചെയ്യപ്പെട്ടിട്ടുണ്ടെങ്കിൽ, ആ എൻട്രി തുടർന്നുള്ള എല്ലാ ലീഡർമാരുടെയും ലോഗുകളിൽ ഉണ്ടായിരിക്കും. കമ്മിറ്റ് ചെയ്ത ഡാറ്റയുടെ നഷ്ടം തടയുന്നതിന് ഇത് നിർണായകമാണ്, ഇത് പ്രധാനമായും തിരഞ്ഞെടുപ്പ് നിയന്ത്രണം ഉറപ്പാക്കുന്നു.
ലോഗ് മാച്ചിംഗ് പ്രോപ്പർട്ടി (Log Matching Property): ഒരേ ഇൻഡെക്സും ടേമും ഉള്ള ഒരു എൻട്രി രണ്ട് ലോഗുകളിൽ ഉണ്ടെങ്കിൽ, ആ ലോഗുകൾ അതിന് മുമ്പുള്ള എല്ലാ എൻട്രികളിലും സമാനമായിരിക്കും. ഇത് ലോഗ് സ്ഥിരതാ പരിശോധനകൾ ലളിതമാക്കുകയും ഫോളോവർമാരുടെ ലോഗുകൾ കാലികമാക്കാൻ ലീഡറിനെ കാര്യക്ഷമമായി സഹായിക്കുകയും ചെയ്യുന്നു.
കമ്മിറ്റ് സുരക്ഷ (Commit Safety): ഒരു എൻട്രി കമ്മിറ്റ് ചെയ്തു കഴിഞ്ഞാൽ, അത് ഒരിക്കലും മാറ്റിവയ്ക്കപ്പെടുകയോ മാറ്റിയെഴുതപ്പെടുകയോ ചെയ്യില്ല. ഇത് ലീഡർ പൂർണ്ണതയുടെയും ലോഗ് മാച്ചിംഗ് പ്രോപ്പർട്ടിയുടെയും നേരിട്ടുള്ള ഫലമാണ്. ഒരു എൻട്രി കമ്മിറ്റ് ചെയ്തു കഴിഞ്ഞാൽ, അത് ശാശ്വതമായി സംഭരിച്ചതായി കണക്കാക്കപ്പെടുന്നു.

റാഫ്റ്റിലെ പ്രധാന ആശയങ്ങളും സംവിധാനങ്ങളും

റോളുകൾക്കും പ്രവർത്തന ഘട്ടങ്ങൾക്കും അപ്പുറം, സ്റ്റേറ്റ് കൈകാര്യം ചെയ്യുന്നതിനും കൃത്യത ഉറപ്പാക്കുന്നതിനും റാഫ്റ്റ് നിരവധി പ്രധാന ആശയങ്ങളെ ആശ്രയിക്കുന്നു.

1. ടേംസ് (Terms)

റാഫ്റ്റിലെ ഒരു term തുടർച്ചയായി വർദ്ധിക്കുന്ന ഒരു സംഖ്യയാണ്. ഇത് ക്ലസ്റ്ററിനായുള്ള ഒരു ലോജിക്കൽ ക്ലോക്കായി പ്രവർത്തിക്കുന്നു. ഓരോ ടേമും ഒരു തിരഞ്ഞെടുപ്പോടെ ആരംഭിക്കുന്നു, തിരഞ്ഞെടുപ്പ് വിജയകരമാണെങ്കിൽ, ആ ടേമിൽ ഒരു സിംഗിൾ ലീഡറിനെ തിരഞ്ഞെടുക്കുന്നു. കാലഹരണപ്പെട്ട വിവരങ്ങൾ തിരിച്ചറിയുന്നതിനും സെർവറുകൾ എല്ലായ്പ്പോഴും ഏറ്റവും പുതിയ വിവരങ്ങളെ ആശ്രയിക്കുന്നുവെന്ന് ഉറപ്പാക്കുന്നതിനും ടേമുകൾ നിർണായകമാണ്:

സെർവറുകൾ എല്ലാ RPC-കളിലും അവരുടെ current term കൈമാറ്റം ചെയ്യുന്നു.
ഒരു സെർവർ അതിൻ്റേതിനേക്കാൾ ഉയർന്ന term ഉള്ള മറ്റൊരു സെർവറിനെ കണ്ടെത്തുകയാണെങ്കിൽ, അത് സ്വന്തം current term അപ്ഡേറ്റ് ചെയ്യുകയും ഒരു follower അവസ്ഥയിലേക്ക് മടങ്ങുകയും ചെയ്യുന്നു.
ഒരു കാൻഡിഡേറ്റ് അല്ലെങ്കിൽ ലീഡർ അതിന്റെ term കാലഹരണപ്പെട്ടതാണെന്ന് (മറ്റൊരു സെർവറിന്റെ term-നേക്കാൾ കുറവാണെങ്കിൽ) കണ്ടെത്തുകയാണെങ്കിൽ, അത് ഉടനടി സ്ഥാനം ഒഴിയുന്നു.

2. ലോഗ് എൻട്രികൾ (Log Entries)

log റാഫ്റ്റിന്റെ പ്രധാന ഘടകമാണ്. ഇത് എൻട്രികളുടെ ഒരു ക്രമീകരിച്ച ശ്രേണിയാണ്, ഓരോ log entry-യും സ്റ്റേറ്റ് മെഷീൻ എക്സിക്യൂട്ട് ചെയ്യേണ്ട ഒരു കമാൻഡിനെ പ്രതിനിധീകരിക്കുന്നു. ഓരോ എൻട്രിയിലും താഴെ പറയുന്നവ ഉൾപ്പെടുന്നു:

കമാൻഡ് (Command): നിർവഹിക്കേണ്ട യഥാർത്ഥ പ്രവർത്തനം (ഉദാഹരണത്തിന്, "set x=5", "create user").
ടേം (Term): ലീഡറിൽ എൻട്രി സൃഷ്ടിക്കപ്പെട്ട ടേം.
ഇൻഡെക്സ് (Index): ലോഗിലെ എൻട്രിയുടെ സ്ഥാനം. ലോഗ് എൻട്രികൾ ഇൻഡെക്സ് അനുസരിച്ച് കർശനമായി ക്രമീകരിച്ചിരിക്കുന്നു.

ലോഗ് പെർസിസ്റ്റന്റ് ആണ്, അതായത്, ക്ലയന്റുകൾക്ക് പ്രതികരിക്കുന്നതിന് മുൻപ് എൻട്രികൾ സ്ഥിരമായ സ്റ്റോറേജിൽ എഴുതപ്പെടുന്നു, ഇത് ക്രാഷുകൾക്കിടെ ഡാറ്റാ നഷ്ടത്തിൽ നിന്ന് സംരക്ഷിക്കുന്നു.

3. സ്റ്റേറ്റ് മെഷീൻ (State Machine)

ഒരു റാഫ്റ്റ് ക്ലസ്റ്ററിലെ ഓരോ സെർവറും ഒരു state machine നിലനിർത്തുന്നു. കമ്മിറ്റ് ചെയ്ത ലോഗ് എൻട്രികൾ പ്രോസസ്സ് ചെയ്യുന്ന ഒരു ആപ്ലിക്കേഷൻ-നിർദ്ദിഷ്ട ഘടകമാണിത്. സ്ഥിരത ഉറപ്പാക്കുന്നതിന്, സ്റ്റേറ്റ് മെഷീൻ ഡിറ്റർമിനിസ്റ്റിക് ആയിരിക്കണം (ഒരേ പ്രാരംഭ അവസ്ഥയും കമാൻഡുകളുടെ ക്രമവും നൽകിയാൽ, അത് എല്ലായ്പ്പോഴും ഒരേ ഔട്ട്പുട്ടും അന്തിമ അവസ്ഥയും ഉത്പാദിപ്പിക്കുന്നു) കൂടാതെ ഐഡെംപോട്ടന്റ് ആയിരിക്കണം (ഒരേ കമാൻഡ് ഒന്നിലധികം തവണ പ്രയോഗിക്കുന്നത് ഒരു തവണ പ്രയോഗിക്കുന്നതിന് സമാനമായ ഫലം നൽകുന്നു, ഇത് വീണ്ടും ശ്രമങ്ങൾ കൈകാര്യം ചെയ്യാൻ സഹായിക്കുന്നു, റാഫ്റ്റിന്റെ ലോഗ് കമ്മിറ്റ്മെന്റ് മിക്കവാറും ഒരു തവണ പ്രയോഗിക്കൽ ഉറപ്പാക്കുന്നു).

4. കമ്മിറ്റ് ഇൻഡെക്സ് (Commit Index)

commitIndex എന്നത് കമ്മിറ്റ് ചെയ്തതായി അറിയപ്പെടുന്ന ഏറ്റവും ഉയർന്ന ലോഗ് എൻട്രിയുടെ ഇൻഡെക്സ് ആണ്. അതായത്, ഇത് ഭൂരിപക്ഷം സെർവറുകളിലേക്ക് സുരക്ഷിതമായി റെപ്ലിക്കേറ്റ് ചെയ്യപ്പെടുകയും സ്റ്റേറ്റ് മെഷീനിലേക്ക് പ്രയോഗിക്കാൻ കഴിയുകയും ചെയ്തിട്ടുണ്ട്. ലീഡർമാർ commitIndex നിർണ്ണയിക്കുന്നു, ഫോളോവർമാർ ലീഡറിന്റെ AppendEntries RPC-കളെ അടിസ്ഥാനമാക്കി അവരുടെ commitIndex അപ്ഡേറ്റ് ചെയ്യുന്നു. commitIndex വരെയുള്ള എല്ലാ എൻട്രികളും സ്ഥിരമായതായി കണക്കാക്കപ്പെടുന്നു, അവ മാറ്റിവയ്ക്കാൻ കഴിയില്ല.

5. സ്നാപ്പ്ഷോട്ടുകൾ (Snapshots)

കാലക്രമേണ, റെപ്ലിക്കേറ്റ് ചെയ്ത ലോഗ് വളരെ വലുതായി വളർന്നേക്കാം, ഇത് ഗണ്യമായ ഡിസ്ക് സ്പേസ് ഉപയോഗിക്കുകയും ലോഗ് റെപ്ലിക്കേഷനും റിക്കവറിയും സാവധാനത്തിലാക്കുകയും ചെയ്യുന്നു. റാഫ്റ്റ് snapshots ഉപയോഗിച്ച് ഇത് പരിഹരിക്കുന്നു. ഒരു സ്നാപ്പ്ഷോട്ട് എന്നത് ഒരു പ്രത്യേക സമയത്ത് സ്റ്റേറ്റ് മെഷീന്റെ അവസ്ഥയുടെ ഒരു സംക്ഷിപ്ത രൂപമാണ്. മുഴുവൻ ലോഗും സൂക്ഷിക്കുന്നതിനു പകരം, സെർവറുകൾക്ക് ഇടയ്ക്കിടെ അവരുടെ അവസ്ഥയുടെ "സ്നാപ്പ്ഷോട്ട്" എടുക്കാനും, സ്നാപ്പ്ഷോട്ട് പോയിന്റ് വരെയുള്ള എല്ലാ ലോഗ് എൻട്രികളും ഒഴിവാക്കാനും, തുടർന്ന് പുതിയതോ പിന്നോട്ട് പോകുന്നതോ ആയ ഫോളോവർമാർക്ക് സ്നാപ്പ്ഷോട്ട് റെപ്ലിക്കേറ്റ് ചെയ്യാനും കഴിയും. ഈ പ്രക്രിയ കാര്യക്ഷമത ഗണ്യമായി മെച്ചപ്പെടുത്തുന്നു:

ഒതുക്കമുള്ള ലോഗ് (Compact Log): പെർസിസ്റ്റന്റ് ലോഗ് ഡാറ്റയുടെ അളവ് കുറയ്ക്കുന്നു.
വേഗതയേറിയ റിക്കവറി (Faster Recovery): പുതിയതോ തകരാറിലായതോ ആയ സെർവറുകൾക്ക് തുടക്കം മുതൽ മുഴുവൻ ലോഗും വീണ്ടും പ്ലേ ചെയ്യുന്നതിനു പകരം ഒരു സ്നാപ്പ്ഷോട്ട് സ്വീകരിക്കാൻ കഴിയും.
InstallSnapshot RPC: ലീഡറിൽ നിന്ന് ഫോളോവർമാർക്ക് സ്നാപ്പ്ഷോട്ടുകൾ കൈമാറാൻ റാഫ്റ്റ് ഒരു InstallSnapshot RPC നിർവചിക്കുന്നു.

ഫലപ്രദമാണെങ്കിലും, സ്നാപ്പ്ഷോട്ടിംഗ് നടപ്പിലാക്കലിൽ സങ്കീർണ്ണത വർദ്ധിപ്പിക്കുന്നു, പ്രത്യേകിച്ച് ഒരേസമയം സ്നാപ്പ്ഷോട്ട് സൃഷ്ടിക്കൽ, ലോഗ് ട്രങ്കേഷൻ, ട്രാൻസ്മിഷൻ എന്നിവ കൈകാര്യം ചെയ്യുന്നതിൽ.

റാഫ്റ്റ് നടപ്പിലാക്കുന്നു: ആഗോള വിന്യാസത്തിനുള്ള പ്രായോഗിക പരിഗണനകൾ

റാഫ്റ്റിന്റെ മനോഹരമായ രൂപകൽപ്പനയെ, പ്രത്യേകിച്ച് ആഗോള പ്രേക്ഷകർക്കും വൈവിധ്യമാർന്ന ഇൻഫ്രാസ്ട്രക്ചറിനും വേണ്ടി, കരുത്തുറ്റതും ഉൽപ്പാദന-സജ്ജവുമായ ഒരു സിസ്റ്റമാക്കി മാറ്റുന്നതിന് നിരവധി പ്രായോഗിക എഞ്ചിനീയറിംഗ് വെല്ലുവിളികൾ അഭിസംബോധന ചെയ്യേണ്ടതുണ്ട്.

1. ആഗോള സാഹചര്യത്തിലെ നെറ്റ്‌വർക്ക് കാലതാമസവും പാർട്ടീഷനുകളും

ആഗോളതലത്തിൽ വിതരണം ചെയ്ത സിസ്റ്റങ്ങൾക്ക്, നെറ്റ്‌വർക്ക് കാലതാമസം ഒരു പ്രധാന ഘടകമാണ്. ഒരു ലോഗ് എൻട്രി കമ്മിറ്റ് ചെയ്യുന്നതിന് ഒരു റാഫ്റ്റ് ക്ലസ്റ്ററിന് സാധാരണയായി ഭൂരിപക്ഷം നോഡുകളുടെ അംഗീകാരം ആവശ്യമാണ്. ഭൂഖണ്ഡങ്ങളിലുടനീളം വ്യാപിച്ചുകിടക്കുന്ന ഒരു ക്ലസ്റ്ററിൽ, നോഡുകൾ തമ്മിലുള്ള കാലതാമസം നൂറുകണക്കിന് മില്ലിസെക്കൻഡ് ആകാം. ഇത് നേരിട്ട് താഴെ പറയുന്നവയെ ബാധിക്കുന്നു:

കമ്മിറ്റ് കാലതാമസം (Commit Latency): ഒരു ക്ലയന്റ് അഭ്യർത്ഥന കമ്മിറ്റ് ചെയ്യാൻ എടുക്കുന്ന സമയം ഭൂരിപക്ഷം റെപ്ലിക്കകളിലേക്കുള്ള ഏറ്റവും വേഗത കുറഞ്ഞ നെറ്റ്‌വർക്ക് ലിങ്ക് വഴി തടസ്സപ്പെടാം. വായിക്കാൻ മാത്രം ശേഷിയുള്ള ഫോളോവർമാർ (കാലഹരണപ്പെട്ട റീഡുകൾക്ക് ലീഡർ ഇടപെടൽ ആവശ്യമില്ല), അല്ലെങ്കിൽ ഭൂമിശാസ്ത്രപരമായി ബോധമുള്ള കോറം കോൺഫിഗറേഷൻ (ഉദാഹരണത്തിന്, ഒരു മേഖലയിൽ 3 നോഡുകൾ, മറ്റൊരു മേഖലയിൽ 2 നോഡുകൾ ഒരു 5-നോഡ് ക്ലസ്റ്ററിനായി, ഇവിടെ ഭൂരിപക്ഷം ഒരു വേഗതയേറിയ മേഖലയ്ക്കുള്ളിൽ ആകാം) പോലുള്ള തന്ത്രങ്ങൾ ഇത് ലഘൂകരിക്കാൻ സഹായിക്കും.
ലീഡർ തിരഞ്ഞെടുപ്പ് വേഗത (Leader Election Speed): ഉയർന്ന കാലതാമസം RequestVote RPC-കളെ വൈകിപ്പിക്കാൻ സാധ്യതയുണ്ട്, ഇത് കൂടുതൽ ഇടയ്ക്കിടെ വോട്ട് പിളരലുകൾക്കോ അല്ലെങ്കിൽ കൂടുതൽ ദൈർഘ്യമുള്ള തിരഞ്ഞെടുപ്പ് സമയങ്ങൾക്കോ ഇടയാക്കും. തിരഞ്ഞെടുപ്പ് സമയപരിധി സാധാരണ നോഡുകൾ തമ്മിലുള്ള കാലതാമസത്തേക്കാൾ ഗണ്യമായി വലുതാക്കാൻ ക്രമീകരിക്കുന്നത് നിർണായകമാണ്.
നെറ്റ്‌വർക്ക് പാർട്ടീഷൻ കൈകാര്യം ചെയ്യൽ (Network Partition Handling): യഥാർത്ഥ ലോക നെറ്റ്‌വർക്കുകൾ പാർട്ടീഷനുകൾക്ക് സാധ്യതയുള്ളതാണ്. റാഫ്റ്റ് പാർട്ടീഷനുകൾ ശരിയായി കൈകാര്യം ചെയ്യുന്നു, ഭൂരിപക്ഷം സെർവറുകൾ അടങ്ങുന്ന പാർട്ടീഷന് മാത്രമേ ഒരു ലീഡറിനെ തിരഞ്ഞെടുക്കാനും മുന്നോട്ട് പോകാനും കഴിയൂ എന്ന് ഉറപ്പാക്കുന്നു. ന്യൂനപക്ഷ പാർട്ടീഷന് പുതിയ എൻട്രികൾ കമ്മിറ്റ് ചെയ്യാൻ കഴിയില്ല, അങ്ങനെ സ്പ്ലിറ്റ്-ബ്രെയിൻ സാഹചര്യങ്ങൾ തടയുന്നു. എന്നിരുന്നാലും, ആഗോളതലത്തിൽ വിതരണം ചെയ്ത സജ്ജീകരണത്തിൽ ദീർഘകാല പാർട്ടീഷനുകൾ ചില പ്രദേശങ്ങളിൽ ലഭ്യമല്ലാത്ത അവസ്ഥയിലേക്ക് നയിച്ചേക്കാം, ഇത് കോറം സ്ഥാപിക്കുന്നതിനെക്കുറിച്ച് ശ്രദ്ധാപൂർവ്വമായ വാസ്തുവിദ്യപരമായ തീരുമാനങ്ങൾ ആവശ്യമാക്കുന്നു.

2. സ്ഥിരമായ സംഭരണവും നിലനിൽപ്പും (Persistent Storage and Durability)

റാഫ്റ്റിന്റെ കൃത്യത അതിന്റെ ലോഗിന്റെയും അവസ്ഥയുടെയും സ്ഥിരതയെ വളരെയധികം ആശ്രയിച്ചിരിക്കുന്നു. ഒരു സെർവർ ഒരു RPC-യോട് പ്രതികരിക്കുന്നതിനോ ഒരു എൻട്രി അതിന്റെ സ്റ്റേറ്റ് മെഷീനിലേക്ക് പ്രയോഗിക്കുന്നതിനോ മുൻപ്, പ്രസക്തമായ ഡാറ്റ (ലോഗ് എൻട്രികൾ, current term, votedFor) സ്ഥിരമായ സ്റ്റോറേജിൽ എഴുതിയെന്നും fsync'd (ഡിസ്കിലേക്ക് ഫ്ലഷ് ചെയ്തു) എന്നും ഉറപ്പാക്കണം. ഇത് തകരാറുകൾ സംഭവിക്കുമ്പോൾ ഡാറ്റാ നഷ്ടം തടയുന്നു. പരിഗണനകളിൽ താഴെ പറയുന്നവ ഉൾപ്പെടുന്നു:

പ്രകടനം (Performance): ഇടയ്ക്കിടെയുള്ള ഡിസ്ക് റൈറ്റുകൾ പ്രകടനത്തിന് ഒരു തടസ്സമായേക്കാം. റൈറ്റുകൾ ബാച്ച് ചെയ്യുന്നതും ഉയർന്ന പ്രകടനമുള്ള SSD-കൾ ഉപയോഗിക്കുന്നതും സാധാരണ ഒപ്റ്റിമൈസേഷനുകളാണ്.
വിശ്വാസ്യത (Reliability): കരുത്തുറ്റതും നിലനിൽക്കുന്നതുമായ ഒരു സ്റ്റോറേജ് സൊല്യൂഷൻ (ലോക്കൽ ഡിസ്ക്, നെറ്റ്‌വർക്ക്-അറ്റാച്ച്ഡ് സ്റ്റോറേജ്, ക്ലൗഡ് ബ്ലോക്ക് സ്റ്റോറേജ്) തിരഞ്ഞെടുക്കുന്നത് നിർണായകമാണ്.
WAL (Write-Ahead Log): പലപ്പോഴും, റാഫ്റ്റ് ഇംപ്ലിമെന്റേഷനുകൾ ഡാറ്റാബേസുകൾക്ക് സമാനമായി ഒരു റൈറ്റ്-എഹെഡ് ലോഗ് ഡ്യൂറബിലിറ്റിക്കായി ഉപയോഗിക്കുന്നു, മാറ്റങ്ങൾ മെമ്മറിയിൽ പ്രയോഗിക്കുന്നതിന് മുൻപ് ഡിസ്കിൽ എഴുതുന്നുവെന്ന് ഉറപ്പാക്കാൻ.

3. ക്ലയന്റ് ഇടപെടലും സ്ഥിരതാ മോഡലുകളും (Client Interaction and Consistency Models)

ക്ലയന്റുകൾ ലീഡറിലേക്ക് അഭ്യർത്ഥനകൾ അയച്ചുകൊണ്ടാണ് റാഫ്റ്റ് ക്ലസ്റ്ററുമായി സംവദിക്കുന്നത്. ക്ലയന്റ് അഭ്യർത്ഥനകൾ കൈകാര്യം ചെയ്യുന്നതിൽ താഴെ പറയുന്നവ ഉൾപ്പെടുന്നു:

ലീഡർ കണ്ടെത്തൽ (Leader Discovery): നിലവിലെ ലീഡറിനെ കണ്ടെത്താൻ ക്ലയന്റുകൾക്ക് ഒരു സംവിധാനം ആവശ്യമാണ്. ഇത് ഒരു സേവന കണ്ടെത്തൽ സംവിധാനം വഴിയോ, റീഡയറക്ട് ചെയ്യുന്ന ഒരു നിശ്ചിത എൻഡ്‌പോയിന്റ് വഴിയോ, അല്ലെങ്കിൽ ഒരു ലീഡറായി പ്രതികരിക്കുന്നത് വരെ സെർവറുകൾ ശ്രമിക്കുന്നതിലൂടെയോ ആകാം.
അഭ്യർത്ഥനകൾ വീണ്ടും ശ്രമിക്കൽ (Request Retries): ലീഡർ മാറുകയോ നെറ്റ്‌വർക്ക് പിശക് സംഭവിക്കുകയോ ചെയ്താൽ അഭ്യർത്ഥനകൾ വീണ്ടും ശ്രമിക്കാൻ ക്ലയന്റുകൾ തയ്യാറായിരിക്കണം.
വായിക്കുന്നതിലെ സ്ഥിരത (Read Consistency): റാഫ്റ്റ് പ്രധാനമായും റൈറ്റുകൾക്ക് ശക്തമായ സ്ഥിരത ഉറപ്പാക്കുന്നു. റീഡുകൾക്ക്, നിരവധി മോഡലുകൾ സാധ്യമാണ്:
- ശക്തമായി സ്ഥിരതയുള്ള റീഡുകൾ (Strongly Consistent Reads): ഒരു ക്ലയന്റിന് അതിന്റെ അവസ്ഥ കാലികമാണെന്ന് ഉറപ്പാക്കാൻ ലീഡറിനോട് ആവശ്യപ്പെടാം, ഒരു റീഡ് നൽകുന്നതിന് മുൻപ് അതിന്റെ ഭൂരിപക്ഷം ഫോളോവർമാർക്ക് ഒരു ഹാർട്ട്ബീറ്റ് അയച്ചുകൊണ്ട്. ഇത് പുതുമ ഉറപ്പാക്കുന്നു എന്നാൽ കാലതാമസം വർദ്ധിപ്പിക്കുന്നു.
- ലീഡർ-ലീസ് റീഡുകൾ (Leader-Lease Reads): ഒരു നിശ്ചിത സമയത്തേക്ക് ഭൂരിപക്ഷം നോഡുകളിൽ നിന്ന് ലീഡറിന് ഒരു 'ലീസ്' നേടാൻ കഴിയും, ഈ സമയത്ത് അത് ഇപ്പോഴും ലീഡറാണെന്ന് അറിയുകയും കൂടുതൽ സമവായമില്ലാതെ റീഡുകൾ നൽകാനും കഴിയും. ഇത് വേഗതയുള്ളതാണ് എന്നാൽ സമയബന്ധിതമാണ്.
- കാലഹരണപ്പെട്ട റീഡുകൾ (ഫോളോവർമാരിൽ നിന്ന്) (Stale Reads (from Followers)): ഫോളോവർമാരിൽ നിന്ന് നേരിട്ട് വായിക്കുന്നത് കുറഞ്ഞ കാലതാമസം നൽകാം, എന്നാൽ ഫോളോവറിന്റെ ലോഗ് ലീഡറിനേക്കാൾ പിന്നിലാണെങ്കിൽ കാലഹരണപ്പെട്ട ഡാറ്റ വായിക്കാനുള്ള സാധ്യതയുണ്ട്. അന്തിമ സ്ഥിരത റീഡുകൾക്ക് മതിയായ ആപ്ലിക്കേഷനുകൾക്ക് ഇത് സ്വീകാര്യമാണ്.

4. കോൺഫിഗറേഷൻ മാറ്റങ്ങൾ (ക്ലസ്റ്റർ അംഗത്വം) (Configuration Changes (Cluster Membership))

ഒരു റാഫ്റ്റ് ക്ലസ്റ്ററിന്റെ അംഗത്വം മാറ്റുന്നത് (സെർവറുകൾ ചേർക്കുകയോ നീക്കം ചെയ്യുകയോ ചെയ്യുന്നത്) ഒരു സങ്കീർണ്ണമായ പ്രവർത്തനമാണ്, ഇത് പൊരുത്തക്കേടുകളോ സ്പ്ലിറ്റ്-ബ്രെയിൻ സാഹചര്യങ്ങളോ ഒഴിവാക്കാൻ സമവായം വഴിയും ചെയ്യണം. റാഫ്റ്റ് ജോയിന്റ് കൺസെൻസസ് (Joint Consensus) എന്ന ഒരു സാങ്കേതിക വിദ്യ നിർദ്ദേശിക്കുന്നു:

രണ്ട് കോൺഫിഗറേഷനുകൾ (Two Configurations): ഒരു കോൺഫിഗറേഷൻ മാറ്റം വരുത്തുമ്പോൾ, സിസ്റ്റം താൽക്കാലികമായി രണ്ട് ഓവർലാപ്പിംഗ് കോൺഫിഗറേഷനുകളുമായി പ്രവർത്തിക്കുന്നു: പഴയ കോൺഫിഗറേഷൻ (C_old) പുതിയ കോൺഫിഗറേഷൻ (C_new).
ജോയിന്റ് കൺസെൻസസ് സ്റ്റേറ്റ് (C_old, C_new): ജോയിന്റ് കോൺഫിഗറേഷനെ പ്രതിനിധീകരിക്കുന്ന ഒരു പ്രത്യേക ലോഗ് എൻട്രി ലീഡർ നിർദ്ദേശിക്കുന്നു. ഈ എൻട്രി കമ്മിറ്റ് ചെയ്തു കഴിഞ്ഞാൽ (C_old-ലെയും C_new-ലെയും ഭൂരിപക്ഷങ്ങളുടെ അംഗീകാരം ആവശ്യമാണ്), സിസ്റ്റം ഒരു പരിവർത്തന അവസ്ഥയിലായിരിക്കും. ഇപ്പോൾ, തീരുമാനങ്ങൾക്ക് രണ്ട് കോൺഫിഗറേഷനുകളിൽ നിന്നും ഭൂരിപക്ഷം ആവശ്യമാണ്. ഇത് പരിവർത്തന സമയത്ത് പഴയ കോൺഫിഗറേഷനോ പുതിയ കോൺഫിഗറേഷനോ ഏകപക്ഷീയമായി തീരുമാനങ്ങൾ എടുക്കുന്നില്ലെന്ന് ഉറപ്പാക്കുന്നു, ഇത് വ്യതിചലനം തടയുന്നു.
C_new-ലേക്ക് മാറുന്നു (Transition to C_new): ജോയിന്റ് കോൺഫിഗറേഷൻ ലോഗ് എൻട്രി കമ്മിറ്റ് ചെയ്തു കഴിഞ്ഞാൽ, പുതിയ കോൺഫിഗറേഷനെ (C_new) മാത്രം പ്രതിനിധീകരിക്കുന്ന മറ്റൊരു ലോഗ് എൻട്രി ലീഡർ നിർദ്ദേശിക്കുന്നു. ഈ രണ്ടാമത്തെ എൻട്രി കമ്മിറ്റ് ചെയ്തു കഴിഞ്ഞാൽ, പഴയ കോൺഫിഗറേഷൻ ഉപേക്ഷിക്കുകയും സിസ്റ്റം C_new-ന്റെ കീഴിൽ മാത്രം പ്രവർത്തിക്കുകയും ചെയ്യുന്നു.
സുരക്ഷ (Safety): ഈ രണ്ട് ഘട്ടങ്ങളുള്ള കമ്മിറ്റ് പോലെയുള്ള പ്രക്രിയ, ഒരു സമയത്തും രണ്ട് പരസ്പരവിരുദ്ധമായ ലീഡർമാരെ തിരഞ്ഞെടുക്കാൻ കഴിയില്ലെന്നും (ഒന്ന് C_old-ന്റെ കീഴിൽ, മറ്റൊന്ന് C_new-ന്റെ കീഴിൽ) മാറ്റം വരുമ്പോൾ സിസ്റ്റം പ്രവർത്തനക്ഷമമായി തുടരുമെന്നും ഉറപ്പാക്കുന്നു.

കോൺഫിഗറേഷൻ മാറ്റങ്ങൾ ശരിയായി നടപ്പിലാക്കുന്നത്, പരിവർത്തന അവസ്ഥയിലെ നിരവധി എഡ്ജ് കേസുകളും തകരാറുകൾ സംഭവിക്കാവുന്ന സാഹചര്യങ്ങളും കാരണം റാഫ്റ്റ് നടപ്പിലാക്കലിന്റെ ഏറ്റവും വെല്ലുവിളി നിറഞ്ഞ ഭാഗങ്ങളിൽ ഒന്നാണ്.

5. വിതരണം ചെയ്ത സിസ്റ്റങ്ങൾ പരീക്ഷിക്കൽ: ഒരു കണിശമായ സമീപനം (Testing Distributed Systems: A Rigorous Approach)

റാഫ്റ്റ് പോലുള്ള ഒരു വിതരണം ചെയ്ത സമവായ അൽഗോരിതം പരീക്ഷിക്കുന്നത് അതിന്റെ നോൺ-ഡിറ്റർമിനിസ്റ്റിക് സ്വഭാവവും നിരവധി തകരാറുകൾ സംഭവിക്കാവുന്ന രീതികളും കാരണം വളരെ വെല്ലുവിളി നിറഞ്ഞതാണ്. ലളിതമായ യൂണിറ്റ് ടെസ്റ്റുകൾ മതിയാകില്ല. കണിശമായ പരീക്ഷണങ്ങളിൽ താഴെ പറയുന്നവ ഉൾപ്പെടുന്നു:

തെറ്റ് കുത്തിവെക്കൽ (Fault Injection): നോഡ് ക്രാഷുകൾ, നെറ്റ്‌വർക്ക് പാർട്ടീഷനുകൾ, സന്ദേശ കാലതാമസങ്ങൾ, സന്ദേശ ക്രമം തെറ്റിക്കൽ എന്നിവ പോലുള്ള തകരാറുകൾ വ്യവസ്ഥാപിതമായി അവതരിപ്പിക്കുന്നു. ജെപ്സൺ (Jepsen) പോലുള്ള ടൂളുകൾ ഈ ആവശ്യത്തിനായി പ്രത്യേകം രൂപകൽപ്പന ചെയ്തവയാണ്.
പ്രോപ്പർട്ടി അധിഷ്ഠിത പരീക്ഷണം (Property-Based Testing): സ്ഥിരാങ്കങ്ങളും സുരക്ഷാ സവിശേഷതകളും (ഉദാഹരണത്തിന്, ഒരു ടേമിൽ പരമാവധി ഒരു ലീഡർ, കമ്മിറ്റ് ചെയ്ത എൻട്രികൾ ഒരിക്കലും നഷ്ടപ്പെടുന്നില്ല) നിർവചിക്കുകയും വിവിധ സാഹചര്യങ്ങളിൽ നടപ്പിലാക്കൽ ഇവയെല്ലാം പാലിക്കുന്നുണ്ടോ എന്ന് പരീക്ഷിക്കുകയും ചെയ്യുന്നു.
മോഡൽ പരിശോധന (Model Checking): അൽഗോരിതത്തിന്റെ നിർണായക ഭാഗങ്ങൾക്ക്, ഔദ്യോഗിക പരിശോധനാ വിദ്യകൾ കൃത്യത തെളിയിക്കാൻ ഉപയോഗിക്കാം, ഇത് വളരെ പ്രത്യേകമായ ഒന്നാണെങ്കിലും.
സിമുലേറ്റ് ചെയ്ത പരിതസ്ഥിതികൾ (Simulated Environments): ആഗോള വിന്യാസങ്ങളിൽ സാധാരണമായ നെറ്റ്‌വർക്ക് സാഹചര്യങ്ങളെ (കാലതാമസം, പാക്കറ്റ് നഷ്ടം) അനുകരിക്കുന്ന പരിതസ്ഥിതികളിൽ ടെസ്റ്റുകൾ പ്രവർത്തിപ്പിക്കുന്നു.

ഉപയോഗ കേസുകളും യഥാർത്ഥ ലോക ആപ്ലിക്കേഷനുകളും (Use Cases and Real-World Applications)

റാഫ്റ്റിന്റെ പ്രായോഗികതയും മനസ്സിലാക്കാനുള്ള എളുപ്പവും വിവിധ നിർണായക ഇൻഫ്രാസ്ട്രക്ചർ ഘടകങ്ങളിൽ ഇത് വ്യാപകമായി സ്വീകരിക്കുന്നതിന് കാരണമായി:

1. വിതരണം ചെയ്ത കീ-വാല്യൂ സ്റ്റോറുകളും ഡാറ്റാബേസ് റെപ്ലിക്കേഷനും (Distributed Key-Value Stores and Database Replication)

etcd: Kubernetes-ന്റെ ഒരു അടിസ്ഥാന ഘടകമായ etcd, കോൺഫിഗറേഷൻ ഡാറ്റ, സേവന കണ്ടെത്തൽ വിവരങ്ങൾ, ക്ലസ്റ്ററിന്റെ അവസ്ഥ കൈകാര്യം ചെയ്യുക എന്നിവ സംഭരിക്കാനും റെപ്ലിക്കേറ്റ് ചെയ്യാനും റാഫ്റ്റ് ഉപയോഗിക്കുന്നു. Kubernetes ശരിയായി പ്രവർത്തിക്കുന്നതിന് ഇതിന്റെ വിശ്വാസ്യത വളരെ പ്രധാനമാണ്.
Consul: ഹാഷി കോർപ്പ് (HashiCorp) വികസിപ്പിച്ച കൺസൽ, അതിന്റെ വിതരണം ചെയ്ത സ്റ്റോറേജ് ബാക്കെൻഡിനായി റാഫ്റ്റ് ഉപയോഗിക്കുന്നു, ഇത് ഡൈനാമിക് ഇൻഫ്രാസ്ട്രക്ചർ പരിതസ്ഥിതികളിൽ സേവന കണ്ടെത്തൽ, ഹെൽത്ത് ചെക്കിംഗ്, കോൺഫിഗറേഷൻ മാനേജ്മെന്റ് എന്നിവ സാധ്യമാക്കുന്നു.
TiKV: TiDB (ഒരു വിതരണം ചെയ്ത SQL ഡാറ്റാബേസ്) ഉപയോഗിക്കുന്ന വിതരണം ചെയ്ത ട്രാൻസാക്ഷണൽ കീ-വാല്യൂ സ്റ്റോർ അതിന്റെ ഡാറ്റാ റെപ്ലിക്കേഷനും സ്ഥിരതാ ഉറപ്പുകൾക്കുമായി റാഫ്റ്റ് നടപ്പിലാക്കുന്നു.
CockroachDB: ഈ ആഗോളതലത്തിൽ വിതരണം ചെയ്ത SQL ഡാറ്റാബേസ്, ഒന്നിലധികം നോഡുകളിലും ഭൂമിശാസ്ത്രപരമായ പ്രദേശങ്ങളിലും ഡാറ്റാ റെപ്ലിക്കേറ്റ് ചെയ്യുന്നതിന് റാഫ്റ്റ് വിപുലമായി ഉപയോഗിക്കുന്നു, ഇത് മേഖലയിലെ മുഴുവൻ തകരാറുകൾക്കിടയിലും ഉയർന്ന ലഭ്യതയും ശക്തമായ സ്ഥിരതയും ഉറപ്പാക്കുന്നു.

2. സേവന കണ്ടെത്തലും കോൺഫിഗറേഷൻ മാനേജ്മെന്റും (Service Discovery and Configuration Management)

ഒരു ക്ലസ്റ്ററിലുടനീളം സേവനങ്ങളെയും കോൺഫിഗറേഷനുകളെയും കുറിച്ചുള്ള നിർണായക മെറ്റാഡാറ്റ സംഭരിക്കാനും വിതരണം ചെയ്യാനും ആവശ്യമായ സിസ്റ്റങ്ങൾക്ക് റാഫ്റ്റ് ഒരു അനുയോജ്യമായ അടിത്തറ നൽകുന്നു. ഒരു സേവനം രജിസ്റ്റർ ചെയ്യുകയോ അതിന്റെ കോൺഫിഗറേഷൻ മാറിക്കൊണ്ടിരിക്കുകയോ ചെയ്യുമ്പോൾ, റാഫ്റ്റ് എല്ലാ നോഡുകളും പുതിയ അവസ്ഥയിൽ最终മായി യോജിക്കുന്നുവെന്ന് ഉറപ്പാക്കുന്നു, ഇത് മനുഷ്യന്റെ ഇടപെടൽ കൂടാതെ ഡൈനാമിക് അപ്‌ഡേറ്റുകൾ സാധ്യമാക്കുന്നു.

3. വിതരണം ചെയ്ത ട്രാൻസാക്ഷൻ കോഓർഡിനേറ്റർമാർ (Distributed Transaction Coordinators)

ഒന്നിലധികം പ്രവർത്തനങ്ങളിലോ സേവനങ്ങളിലോ ആറ്റോമിസിറ്റി ആവശ്യമുള്ള സിസ്റ്റങ്ങൾക്ക്, ട്രാൻസാക്ഷൻ ലോഗുകൾ പങ്കാളികൾക്കിടയിൽ മാറ്റങ്ങൾ കമ്മിറ്റ് ചെയ്യുന്നതിന് മുൻപ് സ്ഥിരമായി റെപ്ലിക്കേറ്റ് ചെയ്യപ്പെടുന്നുവെന്ന് ഉറപ്പാക്കുന്നതിന് റാഫ്റ്റ് വിതരണം ചെയ്ത ട്രാൻസാക്ഷൻ കോഓർഡിനേറ്റർമാരുടെ അടിസ്ഥാനമായി വർത്തിക്കും.

4. മറ്റ് സിസ്റ്റങ്ങളിലെ ക്ലസ്റ്റർ ഏകോപനവും ലീഡർ തിരഞ്ഞെടുപ്പും (Cluster Coordination and Leader Election in Other Systems)

പ്രകടമായ ഡാറ്റാബേസ് അല്ലെങ്കിൽ കീ-വാല്യൂ സ്റ്റോർ ഉപയോഗത്തിന് അപ്പുറം, ഏകോപന ജോലികൾ കൈകാര്യം ചെയ്യാനും മറ്റ് വിതരണം ചെയ്ത പ്രോസസ്സുകൾക്ക് ലീഡർമാരെ തിരഞ്ഞെടുക്കാനും അല്ലെങ്കിൽ വലിയ സിസ്റ്റങ്ങളിൽ വിശ്വസനീയമായ ഒരു നിയന്ത്രണ തലം നൽകാനും റാഫ്റ്റ് ഒരു ലൈബ്രറിയോ പ്രധാന ഘടകമോ ആയി ഉൾച്ചേർക്കാറുണ്ട്. ഉദാഹരണത്തിന്, പല ക്ലൗഡ്-നേറ്റീവ് സൊല്യൂഷനുകളും അവരുടെ കൺട്രോൾ പ്ലെയിൻ ഘടകങ്ങളുടെ അവസ്ഥ കൈകാര്യം ചെയ്യാൻ റാഫ്റ്റ് ഉപയോഗിക്കുന്നു.

റാഫ്റ്റിന്റെ ഗുണങ്ങളും ദോഷങ്ങളും (Advantages and Disadvantages of Raft)

റാഫ്റ്റ് കാര്യമായ നേട്ടങ്ങൾ നൽകുമ്പോൾ, അതിന്റെ പോരായ്മകൾ മനസ്സിലാക്കേണ്ടത് അത്യാവശ്യമാണ്.

ഗുണങ്ങൾ (Advantages):

മനസ്സിലാക്കാനുള്ള എളുപ്പം (Understandability): ഇതിന്റെ പ്രാഥമിക ഡിസൈൻ ലക്ഷ്യം, പാക്സോസ് പോലുള്ള പഴയ സമവായ അൽഗോരിതങ്ങളെക്കാൾ ഇത് നടപ്പിലാക്കാനും, ഡീബഗ് ചെയ്യാനും, ന്യായീകരിക്കാനും എളുപ്പമാക്കുന്നു.
ശക്തമായ സ്ഥിരത (Strong Consistency): കമ്മിറ്റ് ചെയ്ത ലോഗ് എൻട്രികൾക്ക് ശക്തമായ സ്ഥിരതാ ഉറപ്പുകൾ നൽകുന്നു, ഡാറ്റാ സമഗ്രതയും വിശ്വാസ്യതയും ഉറപ്പാക്കുന്നു.
തെറ്റ് സഹിക്കാനുള്ള കഴിവ് (Fault Tolerance): ഭൂരിപക്ഷം നോഡുകളുടെ (ഒരു N-നോഡ് ക്ലസ്റ്ററിൽ (N-1)/2 തകരാറുകൾ വരെ) പരാജയം ലഭ്യതയോ സ്ഥിരതയോ നഷ്ടപ്പെടാതെ സഹിക്കാൻ ഇതിന് കഴിയും.
പ്രകടനം (Performance): സ്ഥിരമായ സാഹചര്യങ്ങളിൽ (ലീഡർ മാറ്റങ്ങളില്ലാതെ), ലീഡർ എല്ലാ അഭ്യർത്ഥനകളും ക്രമത്തിൽ പ്രോസസ്സ് ചെയ്യുകയും സമാന്തരമായി റെപ്ലിക്കേറ്റ് ചെയ്യുകയും ചെയ്യുന്നതിനാൽ റാഫ്റ്റിന് ഉയർന്ന ത്രൂപുട്ട് നേടാൻ കഴിയും, ഇത് നെറ്റ്‌വർക്ക് ബാൻഡ്‌വിഡ്ത്ത് കാര്യക്ഷമമായി ഉപയോഗിക്കുന്നു.
നന്നായി നിർവചിക്കപ്പെട്ട റോളുകൾ (Well-Defined Roles): വ്യക്തമായ റോളുകളും (ലീഡർ, ഫോളോവർ, കാൻഡിഡേറ്റ്) അവസ്ഥാ മാറ്റങ്ങളും മാനസിക മാതൃകയും നടപ്പിലാക്കലും ലളിതമാക്കുന്നു.
കോൺഫിഗറേഷൻ മാറ്റങ്ങൾ (Configuration Changes): സ്ഥിരതയിൽ വിട്ടുവീഴ്ച ചെയ്യാതെ ക്ലസ്റ്ററിൽ നിന്ന് നോഡുകൾ ചേർക്കുന്നതിനോ നീക്കം ചെയ്യുന്നതിനോ ഒരു കരുത്തുറ്റ സംവിധാനം (ജോയിന്റ് കൺസെൻസസ്) വാഗ്ദാനം ചെയ്യുന്നു.

ദോഷങ്ങൾ (Disadvantages):

ലീഡർ തടസ്സം (Leader Bottleneck): എല്ലാ ക്ലയന്റ് റൈറ്റ് അഭ്യർത്ഥനകളും ലീഡർ വഴിയാണ് പോകേണ്ടത്. അത്യധികം ഉയർന്ന റൈറ്റ് ത്രൂപുട്ട് ഉള്ള സാഹചര്യങ്ങളിൽ അല്ലെങ്കിൽ ലീഡർമാർ ക്ലയന്റുകളിൽ നിന്ന് ഭൂമിശാസ്ത്രപരമായി അകലെയാണെങ്കിൽ, ഇത് ഒരു പ്രകടന തടസ്സമായേക്കാം.
റീഡ് കാലതാമസം (Read Latency): ശക്തമായി സ്ഥിരതയുള്ള റീഡുകൾ നേടുന്നതിന് പലപ്പോഴും ലീഡറുമായി ആശയവിനിമയം ആവശ്യമാണ്, ഇത് കാലതാമസം വർദ്ധിപ്പിക്കാൻ സാധ്യതയുണ്ട്. ഫോളോവർമാരിൽ നിന്ന് വായിക്കുന്നത് കാലഹരണപ്പെട്ട ഡാറ്റാ അപകടസാധ്യത വർദ്ധിപ്പിക്കുന്നു.
കോറം ആവശ്യകത (Quorum Requirement): പുതിയ എൻട്രികൾ കമ്മിറ്റ് ചെയ്യുന്നതിന് ഭൂരിപക്ഷം നോഡുകൾ ലഭ്യമായിരിക്കണം. ഒരു 5-നോഡ് ക്ലസ്റ്ററിൽ, 2 തകരാറുകൾ സഹിക്കാവുന്നതാണ്. 3 നോഡുകൾ തകരാറിലായാൽ, റൈറ്റുകൾക്ക് ക്ലസ്റ്റർ ലഭ്യമല്ലാതാകും. ഉയർന്ന പാർട്ടീഷൻ ചെയ്യപ്പെട്ടതോ ഭൂമിശാസ്ത്രപരമായി ചിതറിക്കിടക്കുന്നതോ ആയ പരിതസ്ഥിതികളിൽ, മേഖലകളിലുടനീളം ഭൂരിപക്ഷം നിലനിർത്തുന്നത് ബുദ്ധിമുട്ടായിരിക്കുമ്പോൾ ഇത് വെല്ലുവിളിയാകാം.
നെറ്റ്‌വർക്ക് സെൻസിറ്റിവിറ്റി (Network Sensitivity): നെറ്റ്‌വർക്ക് കാലതാമസത്തോടും പാർട്ടീഷനുകളോടും വളരെ സംവേദനക്ഷമമാണ്, ഇത് തിരഞ്ഞെടുപ്പ് സമയങ്ങളെയും മൊത്തത്തിലുള്ള സിസ്റ്റം ത്രൂപുട്ടിനെയും ബാധിക്കും, പ്രത്യേകിച്ചും വ്യാപകമായി വിതരണം ചെയ്ത വിന്യാസങ്ങളിൽ.
കോൺഫിഗറേഷൻ മാറ്റങ്ങളുടെ സങ്കീർണ്ണത (Complexity of Configuration Changes): കരുത്തുറ്റതാണെങ്കിലും, ജോയിന്റ് കൺസെൻസസ് സംവിധാനം റാഫ്റ്റ് അൽഗോരിതത്തിന്റെ ഏറ്റവും സങ്കീർണ്ണമായ ഭാഗങ്ങളിലൊന്നാണ്, ഇത് ശരിയായി നടപ്പിലാക്കാനും പൂർണ്ണമായി പരീക്ഷിക്കാനും ബുദ്ധിമുട്ടാണ്.
സിംഗിൾ പോയിന്റ് ഓഫ് ഫെയിലർ (റൈറ്റുകൾക്ക്) (Single Point of Failure (for Writes)): ലീഡർ തകരാറുകൾക്ക് തെറ്റ് സഹിക്കാൻ കഴിയുന്നതാണെങ്കിലും, ലീഡർ ശാശ്വതമായി പ്രവർത്തനരഹിതമാകുകയും ഒരു പുതിയ ലീഡറിനെ തിരഞ്ഞെടുക്കാൻ കഴിയാതെ വരികയും ചെയ്താൽ (ഉദാഹരണത്തിന്, നെറ്റ്‌വർക്ക് പാർട്ടീഷനുകൾ അല്ലെങ്കിൽ വളരെയധികം തകരാറുകൾ കാരണം), സിസ്റ്റത്തിന് റൈറ്റുകളിൽ മുന്നോട്ട് പോകാൻ കഴിയില്ല.

ഉപസംഹാരം: പ്രതിരോധശേഷിയുള്ള ആഗോള സിസ്റ്റങ്ങൾക്കായി വികേന്ദ്രീകൃത സമവായം കൈകാര്യം ചെയ്യുക

സങ്കീർണ്ണമായ പ്രശ്നങ്ങളെ ലളിതമാക്കുന്നതിൽ ചിന്താപൂർവ്വമായ രൂപകൽപ്പനയുടെ ശക്തിക്ക് ഒരു തെളിവാണ് റാഫ്റ്റ് അൽഗോരിതം. മനസ്സിലാക്കാനുള്ള എളുപ്പത്തിന് പ്രാധാന്യം നൽകുന്നത് വികേന്ദ്രീകൃത സമവായത്തെ ജനാധിപത്യവൽക്കരിച്ചു, മുൻ സമീപനങ്ങളുടെ നിഗൂഢമായ സങ്കീർണ്ണതകൾക്ക് വഴങ്ങാതെ ഉയർന്ന ലഭ്യതയുള്ളതും തെറ്റ് സഹിക്കാൻ കഴിയുന്നതുമായ സിസ്റ്റങ്ങൾ നിർമ്മിക്കാൻ കൂടുതൽ ഡെവലപ്പർമാർക്കും ഓർഗനൈസേഷനുകൾക്കും ഇത് സാധ്യമാക്കി.

Kubernetes (etcd വഴി) ഉപയോഗിച്ച് കണ്ടെയ്നർ ക്ലസ്റ്ററുകൾ ഓർക്കസ്ട്രേറ്റ് ചെയ്യുന്നത് മുതൽ CockroachDB പോലുള്ള ആഗോള ഡാറ്റാബേസുകൾക്ക് പ്രതിരോധശേഷിയുള്ള ഡാറ്റാ സംഭരണം നൽകുന്നത് വരെ, റാഫ്റ്റ് ഒരു നിശബ്ദ ജോലിക്കാരനായി നിലകൊള്ളുന്നു, നമ്മുടെ ഡിജിറ്റൽ ലോകം സ്ഥിരവും പ്രവർത്തനക്ഷമവുമായി തുടരുന്നുവെന്ന് ഉറപ്പാക്കുന്നു. റാഫ്റ്റ് നടപ്പിലാക്കുന്നത് നിസ്സാരമായ ഒരു കാര്യമല്ല, എന്നാൽ അതിന്റെ സ്പെസിഫിക്കേഷന്റെ വ്യക്തതയും ചുറ്റുമുള്ള ആവാസവ്യവസ്ഥയുടെ സമ്പന്നതയും കരുത്തുറ്റതും വികസിപ്പിക്കാവുന്നതുമായ അടുത്ത തലമുറയിലെ ഇൻഫ്രാസ്ട്രക്ചർ നിർമ്മിക്കാൻ പ്രതിജ്ഞാബദ്ധരായവർക്ക് ഇത് ഒരു പ്രതിഫലദായകമായ ശ്രമമാക്കി മാറ്റുന്നു.

ഡെവലപ്പർമാർക്കും ആർക്കിടെക്റ്റുകൾക്കും വേണ്ടിയുള്ള പ്രായോഗിക ഉൾക്കാഴ്ചകൾ:

മനസ്സിലാക്കുന്നതിന് മുൻഗണന നൽകുക (Prioritize Understanding): ഒരു നടപ്പിലാക്കലിന് ശ്രമിക്കുന്നതിന് മുൻപ്, റാഫ്റ്റിന്റെ ഓരോ നിയമവും അവസ്ഥാ മാറ്റവും സമഗ്രമായി മനസ്സിലാക്കാൻ സമയം കണ്ടെത്തുക. യഥാർത്ഥ പേപ്പറും ദൃശ്യപരമായ വിശദീകരണങ്ങളും വിലമതിക്കാനാവാത്ത ഉറവിടങ്ങളാണ്.
നിലവിലുള്ള ലൈബ്രറികൾ ഉപയോഗിക്കുക (Leverage Existing Libraries): മിക്ക ആപ്ലിക്കേഷനുകൾക്കും, നിങ്ങളുടെ ആവശ്യകതകൾ വളരെ പ്രത്യേകമായതോ അക്കാദമിക് ഗവേഷണം നടത്തുകയാണെങ്കിലോ അല്ലാതെ, സ്ക്രാച്ചിൽ നിന്ന് നിർമ്മിക്കുന്നതിന് പകരം നന്നായി പരിശോധിച്ച നിലവിലുള്ള റാഫ്റ്റ് നടപ്പിലാക്കലുകൾ (ഉദാഹരണത്തിന്, etcd-ൽ നിന്ന്, HashiCorp-ന്റെ റാഫ്റ്റ് ലൈബ്രറി) ഉപയോഗിക്കുന്നത് പരിഗണിക്കുക.
കണിശമായ പരീക്ഷണം നിർബന്ധമാണ് (Rigorous Testing is Non-Negotiable): ഫാൾട്ട് ഇൻജക്ഷൻ, പ്രോപ്പർട്ടി അധിഷ്ഠിത പരീക്ഷണം, പരാജയ സാഹചര്യങ്ങളുടെ വിപുലമായ സിമുലേഷൻ എന്നിവ ഏതൊരു വിതരണം ചെയ്ത സമവായ സിസ്റ്റത്തിനും പരമപ്രധാനമാണ്. സമഗ്രമായി തകർക്കാതെ "ഇത് പ്രവർത്തിക്കുന്നു" എന്ന് ഒരിക്കലും അനുമാനിക്കരുത്.
ആഗോള കാലതാമസം കണക്കിലെടുത്ത് രൂപകൽപ്പന ചെയ്യുക (Design for Global Latency): ആഗോളതലത്തിൽ വിന്യസിക്കുമ്പോൾ, നിങ്ങളുടെ കോറം സ്ഥാപിക്കൽ, നെറ്റ്‌വർക്ക് ടോപ്പോളജി, ക്ലയന്റ് റീഡ് തന്ത്രങ്ങൾ എന്നിവ ശ്രദ്ധാപൂർവ്വം പരിഗണിച്ച് വിവിധ ഭൂമിശാസ്ത്രപരമായ പ്രദേശങ്ങളിലുടനീളം സ്ഥിരതയ്ക്കും പ്രകടനത്തിനും വേണ്ടി ഒപ്റ്റിമൈസ് ചെയ്യുക.
പെർസിസ്റ്റൻസ് ആൻഡ് ഡ്യൂറബിലിറ്റി (Persistence and Durability): നിങ്ങളുടെ അടിത്തറയിലുള്ള സ്റ്റോറേജ് ലെയർ കരുത്തുറ്റതാണെന്നും ക്രാഷ് സാഹചര്യങ്ങളിൽ ഡാറ്റാ നഷ്ടം തടയുന്നതിന് fsync അല്ലെങ്കിൽ തത്തുല്യമായ പ്രവർത്തനങ്ങൾ ശരിയായി ഉപയോഗിക്കുന്നുണ്ടെന്നും ഉറപ്പാക്കുക.

വിതരണം ചെയ്ത സിസ്റ്റങ്ങൾ വികസിച്ചുകൊണ്ടിരിക്കുമ്പോൾ, റാഫ്റ്റ് ഉൾക്കൊള്ളുന്ന തത്വങ്ങൾ—വ്യക്തത, കരുത്ത്, തെറ്റ് സഹിക്കാനുള്ള കഴിവ്—വിശ്വസനീയമായ സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയറിംഗിന്റെ അടിസ്ഥാനശിലയായി തുടരും. റാഫ്റ്റ് കൈകാര്യം ചെയ്യുന്നതിലൂടെ, വിതരണം ചെയ്ത കമ്പ്യൂട്ടിംഗിന്റെ അനിവാര്യമായ കുഴപ്പങ്ങളെ അതിജീവിക്കാൻ കഴിയുന്ന പ്രതിരോധശേഷിയുള്ള, ആഗോളതലത്തിൽ വികസിപ്പിക്കാവുന്ന ആപ്ലിക്കേഷനുകൾ നിർമ്മിക്കാൻ ആവശ്യമായ ശക്തമായ ഒരു ഉപകരണം നിങ്ങൾ സ്വയം സജ്ജീകരിക്കുന്നു.